株式会社キャリア・マム(本社:東京都多摩市、代表取締役:堤 香苗)は、2024年7月23日に自然言語処理、LLM構築の先駆者である理化学研究所の関根 聡 氏を特別講師に招き、ウェビナー「生成AI LLM構築セミナー ~インストラクションチューニングデータ作成時のポイントとその事例~」を開催します。
理化学研究所は、2023年より複数企業との共同研究「LLMのための日本語インストラクションデータ作成プロジェクト」を掲げ、そのデータ制作数は2024年2月末日に1万件に到達。キャリア・マムは、インストラクションデータ制作外注先3社のうちの1社として制作に参加し、広く一般的な質問とそれに対する適切な回答を担当。質の高い日本語に特化したインストラクションデータを作成しました。
実用的な大規模言語モデル(LLM)の構築には、モデルの精度を大きく左右するいくつかのポイントがあります。そのひとつがインストラクションデータの妥当性であり、LLM構築時には、適切なデータの基準を正しく見極め、揃えることを重要視すべきです。
当セミナーでは、今回の開発を具体的な事例とし、インストラクションデータを制作する際に基準となる事項や度合いについて関根氏が解説、後半はパネルディスカッション形式で、データの作成やチューニングに関するコツ、アノテーターに必要な資質や進化していくLLMについて、ご紹介します。
関根氏の解説は、LLM構築におけるインストラクションデータの重要性やデータ作成時のポイントはもちろん、言語AIの最新動向、貴社ビジネスへの適用・応用について知見を得る好機です。AI開発者やビジネス戦略担当者にとって、貴重な情報を得る時間となるでしょう。
また、キャリア・マムがLLMのインストラクションデータ作成を担当できる理由や独自のメソッドは、お客様の新たな気づきの糧となり、事業戦略立案・イノベーション創出をアシストします。
【セミナー概要】
名称 :生成AI LLM構築セミナー
~インストラクションチューニングデータ作成時のポイントとその事例~
開催日時:2024年7月23日 12:00~12:55
会場 :オンライン開催
(お申し込みいただいた方に、ウェビナーのURLをお送りいたします)
参加費 :無料
*お申し込みフォーム*
https://www.c-mam.co.jp/member/app.php?no=4239
【プログラム】
●第1部
1. LLM構築時のデータインストラクションの重要性と事例
2. LLM構築データの安全性確保の重要性とその考え方
【特別講師紹介】
国立研究開発法人理化学研究所 革新知能統合研究センター
言語情報アクセス技術チーム チームリーダー
関根 聡 氏(Ph.D.)
大学卒業後に入社した松下電器産業株式会社(現・パナソニック株式会社)で、生涯のテーマとなる自然言語処理に出会う。その後、1992年に英国マンチェスター大学で修士号を、1998年にニューヨーク大学で博士号を取得後、2007年に同大学の准教授に就任。2024年4月からは情報学研究所LLM研究開発センター特任教授を兼任。自然言語処理技術のなかでも情報抽出、言語的知識獲得、言語解析などの分野で第一人者として知られる。
●第2部
パネルディスカッション「LLM構築時のデータ作成:インストラクションチューニング時のコツ」
インストラクションデータ作成時の事例に基づき、実際の調整内容や作成順序、段階などを紹介します。そのほか、キャリア・マムより納期に合わせた作成までのメンバーアサイン、研修方法、チェック方法などのコツを、理化学研究所 革新知能統合研究センター テクニカルスタッフ 後藤 美知子様より納品されたデータのチェック方法について解説。データ連携の重要性について、パネルディスカッション形式でお話します。
〈登壇者〉
理化学研究所 関根 聡 氏
理化学研究所 テクニカルスタッフ 後藤 美知子 氏
株式会社キャリア・マム 制作マネージャー 小尾 和美
〈ファシリテーター〉
株式会社キャリア・マム 代表取締役 堤 香苗