ایراد بزرگی که ژاپنی ها در هوش مصنوعی مشهور پیدا کردند

به گزارش تور آسیایی ارزان، ایسنا نوشت: بعضی از محققان ژاپنی احساس می نمایند که سیستم های هوش مصنوعی آموزش دیده بر اساس زبان های خارجی غیر ژاپنی نمی توانند پیچیدگی های زبان و فرهنگ ژاپنی را درک نمایند، بنابراین اکنون می خواهند نسخه ای از چت جی پی تی مخصوص ژاپن را توسعه دهند.

ژاپن در حال ساخت نسخه های خود از چت جی پی تی (ChatGPT) است. این ربات هوش مصنوعی که به وسیله شرکت آمریکایی OpenAI ساخته شده است پس از رونمایی در کمتر از یک سال قبل، به طور دنیای مورد توجه نهاده شد.

دولت ژاپن و شرکت های بزرگ فناوری مانند NEC، فوجیتسو و سافت بانک صدها میلیون دلار برای ایجاد سیستم های هوش مصنوعی صرف می نمایند که بر اساس همان فناوری زیربنایی معروف به مدل های زبانی بزرگ کار می نمایند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده می نمایند.

کیسوکه ساکاگوچی (Keisuke Sakaguchi)، محقق دانشگاه توهوکو در ژاپن که متخصص پردازش زبان طبیعی است، می گوید: مدل های زبانی بزرگ عمومی فعلی، مانند جی پی تی، در زبان انگلیسی فزونی دارند، اما اغلب در زبان ژاپنی به علت تفاوت در سیستم الفبا، داده های محدود و سایر عوامل دچار کاستی هستند.

تعصب زبان انگلیسی

مدل های زبانی بزرگ به طور معمول از حجم عظیمی از داده ها و منابع در دسترس عموم برای یادگیری الگوهای گفتار و نثر طبیعی استفاده می نمایند. آنها آموزش می بینند که کلمه بعدی را بر اساس کلمات قبلی در یک متن پیش بینی نمایند. بیشتریت قریب به اتفاق متنی که مدل قبلی چت جی پی تی یعنی جی پی تی -3 (GPT-3)، براساس آن آموزش داده شده بود، به زبان انگلیسی بود.

توانایی قابل توجه چت جی پی تی در برقراری مکالمات مشابه انسان، هم محققان را شاد و هم نگران نموده است. بعضی آن را یک ابزار بالقوه برای صرفه جویی در نیروی کار می دانند در حالی که دیگران نگران هستند که از آن برای ساخت مقالات یا داده های علمی استفاده گردد.

در ژاپن، این نگرانی وجود دارد که سیستم های هوش مصنوعی آموزش دیده بر روی مجموعه های داده به زبان های دیگر نتوانند پیچیدگی های زبان و فرهنگ ژاپن را درک نمایند. ساختار جملات در زبان ژاپنی کاملا متفاوت از انگلیسی است. بنابراین چت جی پی تی باید یک درخواست ژاپنی را به انگلیسی ترجمه کند، پاسخ را بیابد و سپس پاسخ را به ژاپنی ترجمه کند.

در حالی که زبان انگلیسی تنها 26 حرف دارد، زبان ژاپنی نوشتاری متشکل از دو مجموعه 48 حرفی اصلی، به علاوه 2136 نویسه چینی یا کانجی است که به طور منظم استفاده می گردد. بیشتر کانجی ها دو یا چند تلفظ دارند و 50 هزار کانجی دیگر وجود دارد که به ندرت استفاده می گردد. با توجه به این پیچیدگی، جای تعجب نیست که چت جی پی تی نتواند با این زبان دست و پنجه نرم کند.

ساکاگوچی می گوید در زبان ژاپنی، چت جی پی تی گاهی اوقات نویسه های بسیار کمیابی فراوری می نماید که بیشتر مردم هرگز آن ها را ندیده اند و در نتیجه کلمات ناشناخته عجیب و غریب به وجود می آید.

هنجارهای فرهنگی

برای اینکه یک مدل زبانی بزرگ مفید و حتی از نظر تجاری قابل دوام باشد، باید فرهنگ و بعلاوه زبان را به طور دقیق منعکس کند. برای مثال، اگر از چت جی پی تی خواسته گردد که یک ایمیل درخواست شغل به زبان ژاپنی بنویسد، ممکن است عبارات استاندارد ادبی را حذف کند و نتیجه آن مانند ترجمه ای واضح از انگلیسی به نظر برسد.

برای سنجش مقدار حساسیت مدل های زبانی بزرگ نسبت به فرهنگ ژاپنی، گروهی از محققان راکودا (Rakuda) را راه اندازی کردند. راکودا رتبه بندی است که نشان می دهد مدل های زبانی بزرگ تا چه میزان می توانند به سوالات باز در خصوص موضوعات ژاپنی پاسخ دهند.

سم پاساگلیا (Sam Passaglia)، بنیانگذار راکودا و همکارانش، از چت جی پی تی خواستند که روان بودن و تناسب فرهنگی پاسخ ها را با درخواست های استاندارد مقایسه کند.

پاساگلیا، فیزیکدان دانشگاه توکیو که مدل های زبان ژاپنی را مطالعه می نماید، می گوید: مسلما مدل های زبانی بزرگ ژاپنی بهبود زیادی می یابند، اما در حال حاضر آنها بسیار عقب تر از جی پی تی -4 هستند. او می گوید، اصولا علتی وجود ندارد که یک مدل زبانی بزرگ ژاپنی نتواند در آینده برابر با جی پی تی-4 باشد یا از آن پیشی بگیرد. این از نظر فنی قابل حل است، اما مشکل منابع وجود دارد.

یکی از کوشش ها برای ایجاد یک مدل زبانی بزرگ ژاپنی استفاده از ابررایانه ژاپنی فوگاکو (Fugaku) است. فوگاکو که یکی از سریع ترین های دنیا است عمدتا مدل زبانی را بر اساس ورودی ژاپنی آموزش می دهد.

با حمایت موسسه فناوری توکیو، دانشگاه توهوکو، فوجیتسو و گروه مراکز تحقیقاتی ریکن (RIKEN) با بودجه دولتی، انتظار می رود مدل زبانی حاصل در سال آینده منتشر گردد.

این مدل زبانی بزرگ برخلاف جی پی تی-4 و سایر مدل های اختصاصی، به سایر مدل های زبانی منبع باز ملحق می گردد تا کد خود را در دسترس همه کاربران قرار دهد. به گفته ساکاگوچی، که در این پروژه مشارکت دارد، محققان امیدوارند دستکم 30 میلیارد پارامتر به آن بدهد که بر خروجی آن تأثیر می گذارد و می توانند به عنوان معیاری برای میزان آن عمل کند.

با این حال، مدل زبانی فوگاکو ممکن است به وسیله یک مدل حتی بزرگتر جانشین گردد.

وزارت آموزش، فرهنگ، ورزش، علم و فناوری ژاپن بودجه ایجاد یک برنامه هوش مصنوعی ژاپنی را که مطابق با احتیاجهای علمی است، تامین می نماید که با یادگیری از تحقیقات منتشر شده، فرضیه های علمی ایجاد کند و به شناسایی اهداف برای تحقیقات سرعت بخشد. این مدل می تواند با 100 میلیارد پارامتر شروع به کار کند که کمی بیش از نیمی از میزان جی پی تی-3 است و به مرور زمان توسعه می یابد.

ماکوتو تایجی (Makoto Taiji)، معاون مرکز تحقیقات دینامیک بیوسیستم ریکن، در خصوص این پروژه می گوید: امیدواریم چرخه تحقیقات علمی را به طور چشمگیری سرعت بخشیم و فضای جستجو را توسعه دهیم. توسعه مدل زبانی بزرگ دستکم 30 میلیارد ین (204 میلیون دلار آمریکا) هزینه خواهد داشت و انتظار می رود در سال 2031 به صورت عمومی منتشر گردد.

توسعه قابلیت ها

دیگر شرکت های ژاپنی در حال تجاری سازی یا برنامه ریزی برای تجاری سازی فناوری های مدل های زبانی بزرگ خود هستند.

سازنده ابر رایانه NEC در ماه مه استفاده از هوش مصنوعی مولد خود را بر اساس زبان ژاپنی شروع کرد و ادعا می نماید که این مدل زبانی زمان مورد احتیاج برای ایجاد گزارش های داخلی را 50 درصد و کد منبع نرم افزار داخلی را 80 درصد کاهش می دهد. در ماه ژوئیه، این شرکت شروع به ارائه خدمات هوش مصنوعی با قابلیت شخصی سازی به مشتریان کرد.

ماسافومی اویامادا (Masafumi Oyamada)، محقق اصلی در آزمایشگاه های علوم داده NEC، می گوید که می توان از آن در طیف وسیعی از صنایع مانند صنایع مالی، حمل ونقل و تدارکات، توزیع و ساخت استفاده کرد. او اضافه می نماید که محققان می توانند آن را برای نوشتن کد، یاری به نوشتن و ویرایش مقالات و آنالیز مقالات منتشر شده موجود استفاده نمایند.

در همین حال، شرکت مخابراتی ژاپنی سافت بانک (SoftBank)، حدود 20 میلیارد ین روی هوش مصنوعی مولد آموزش داده شده بر روی متون ژاپنی سرمایه گذاری نموده و میخواهد سال آینده مدل زبانی بزرگ خود را راه اندازی کند. سافت بانک که 40 میلیون مشتری دارد و با مایکروسافت سرمایه گذار شرکت OpenAI نیز شراکت دارد، می گوید که میخواهد به شرکت ها یاری کند تا کسب و کار خود را دیجیتالی نمایند و بهره وری خود را افزایش دهند. سافت بانک انتظار دارد که مدل زبانی بزرگ آن ها به وسیله دانشگاه ها، موسسات تحقیقاتی و سایر سازمان ها مورد استفاده قرار گیرد.

در همین حال، محققان ژاپنی امیدوارند که یک چت بات هوش مصنوعی دقیق، موثر و ساخت ژاپن بتواند به سرعت بخشیدن به علم و پر کردن شکاف بین ژاپن و سایر نقاط دنیا یاری کند.

5858

منبع: خبرآنلاین

انتشار: 25 شهریور 1402 بروزرسانی: 25 شهریور 1402 گردآورنده: asiaro.ir شناسه مطلب: 2314