ノーマルビュー

数学特化の大規模言語モデル「WizardMath」

著者: nagazou
2023年8月29日 13:32
米Microsoftと中国科学院の研究者が「WizardMath」という大規模な数学特化の言語モデルを開発した(論文ITmedia)。 このモデルは、数学的な推論能力を向上させることを目指している。このモデルは、オープンソースの事前学習済み大規模言語モデル(LLM)である「Llama-2」に対して適用することで実現する。Llamaモデルシリーズはオープンソースの大規模言語モデルで、クローズドソースのモデルとの差を縮める役割を果たしているが、数学や科学のような多段階の推論が求められる場面には課題があったとされる。

研究ではこの問題点に着目し、Llama-2の数学的推論能力を向上させる手法「WizardMath」を提案。「Reinforcement Learning from Evol-Instruct Feedback」(RLEIF)という新しい手法を用いてLlama-2の数学的推論能力を向上させたという。実験の結果、WizardMathは数学的推論ベンチマークであるGSM8kとMATHにおいて、他のオープンソースの言語モデルを大きく上回る性能を示したそうだ。具体的には、GSM8kでは+24.8、MATHでは+9.2の向上が見られたとのこと。また、OpenAIのChatGPT-3.5やAnthropicのClaude Instant-1、GoogleのPaLM-2などのモデルに比べても、特にGSM8kの成績においてはWizardMathは優れた性能を発揮していたとしている。

Kuritsukasa 曰く、

AGIに近づいているかと思われていたAI開発だけど、ここに来て数学特化型のLLMが登場

すべて読む | サイエンスセクション | テクノロジー | 人工知能 | 数学 | この記事をTwitterでつぶやく この記事をFacebookで共有 この記事をGoogle Plusで共有 このエントリーをはてなブックマークに追加

関連ストーリー:
デスクトップ版Brave Nightly、AIアシスタント「Brave Leo」が利用可能に 2023年08月26日
商用利用禁止のAI言語モデルがオープンソースと称して公開され、騒動に 2023年08月22日
AIの学習データが不足する「2026年問題」 2023年07月26日
米Meta、生成AI「Llama 2」商用版を無料で提供へ 2023年07月24日

AI生成文章を"新証言"として展示する関東大震災100年企画、取りやめへ

著者: nagazou
2023年8月29日 13:03
日赤東京都支部は24日、企画展「関東大震災 100年前の100人の新証言」とインターネット公開を中止すると発表した。企画展は、26日から東京都新宿区の同支部など2か所で開催予定だった(関東大震災100年プロジェクトの実施取りやめに関するお知らせ産経新聞ITmedia)。

この企画展は関東大震災の史料などをChatGPTをベースとするLLMに当時の文献60万字以上の情報を読み込ませ、新たに作り出した文章を証言として展示するというものだった。一部については人物画像もAIで生成した。しかし企画内容が報じられると、SNSを中心に同支部によると、「歴史の捏造につながるのでは」「フェイクニュースだ」「冒涜では?」など批判的な声が多く上がっていた。担当者は「新証言という表現を使って、実在した人が話したかのような内容にしたことで誤解を招いてしまった」と話している。

すべて読む | テクノロジー | 人工知能 | この記事をTwitterでつぶやく この記事をFacebookで共有 この記事をGoogle Plusで共有 このエントリーをはてなブックマークに追加

関連ストーリー:
米連邦地裁、著作権局によるAI生成作品の著作権登録拒絶は適切と判断 2023年08月23日
商用利用禁止のAI言語モデルがオープンソースと称して公開され、騒動に 2023年08月22日
AP、生成AI利用に関するガイドラインを公表 2023年08月18日
あらいずみるい氏、SNSで生成AI疑惑を持たれため作画過程を公開 2023年08月17日

❌