ChatGPT 開発の背後にはケニアの労働者による人力作業
注目を集める OpenAI の対話向け言語モデル ChatGPT だが、その開発には 1 時間 2 ドル以下で働くケニアの労働者が多数かかわっていたという
(TIME の記事、
Windows Central の記事、
The Register の記事)。ChatGPT の前に OpenAI が開発した GPT-3 は高精度な文章生成能力を示していたが、学習に使用した素材の関係で一般的な使用に向かない有害なコンテンツを生成することもあった。このような失敗を繰り返さないためには、ヘイトスピーチや暴力、性的虐待といった有害なコンテンツを回避する AI が必要になる。そのため、OpenAIではインターネットのダークサイドから抽出した数万件のテキストスニペットへのラベル付けを米サンフランシスコの Sama とにアウトソーシングした。Sama はケニアやウガンダ、インドで労働者を雇い、IT 企業からの依頼を受けてデータにラベル付けを行う企業だ。
Sama は 2021 年 11 月から作業を開始したが、TIME がインタビューした Sama の従業員によれば暴力や性的虐待などを生々しく描いたテキストにラベル付けする作業は拷問のようだったという。2022 年 2 月には別プロジェクトとして性的および暴力的な画像を収集する作業のパイロットプログラムも開始したが、契約時に言及のなかった違法なコンテンツの収集を要求された Sama は作業を打ち切り、他のプロジェクトもすべて終了するとOpenAI に通告。同月、予定より早く契約を打ち切ることになった。
Sama は従業員のトラウマになるような作業を続けさせたくなかったと説明するが、TIME が 2 月 14 日に発行した Facebook の過酷なコンテンツモデレーションに関する記事で作業を請け負う企業として Sama が紹介されたことも関係しているという。記事が出てから 3 日後、Sama はルフトハンザ航空の子会社 zeroG から契約を打ち切られており、これを契機として OpenAI との契約を打ち切ることにしたようだ。
Sama は自然言語処理とコンテンツモデレーションをやめてコンピュータービジョンに注力する計画を進めており、今年 1 月 10 日には Facebook のコンテンツモデレーションを含むセンシティブなコンテンツにかかわる業務をすべて打ち切ると発表している。Sama がやめても AI システムのために人力でデータにラベル付けする需要はなくならない。大量の人力作業とスクレイピングデータを必要とすることは根本的な問題だが、OpenAI が対処しているようには見えないと AI 倫理が専門の Andrew Strait 氏は述べている。
すべて読む
| デベロッパーセクション
| 人工知能
| デベロッパー
|
関連ストーリー:
ChatGPTはコミュニケーションが困難な人を助けるかもしれない
2023年01月25日
Stack OverflowがChatGPTによる回答を禁止、大量のもっともらしい回答に対処できず
2022年12月07日
複雑な問いかけにも回答するチャットAI「ChatGPT」がテスト公開
2022年12月05日
LinuxにAIを通してインタビューする試み
2022年10月03日
カーネギーメロン大学、オープンソースのコード生成AI「PolyCoder」
2022年03月11日
Microsoft、英語文章をプログラミング言語に変換する技術を「Power Apps」に追加へ
2021年05月27日
テキストから画像を生成するニューラルネットワーク「DALL·E」
2021年01月09日
朝日新聞社メディアラボ、機械学習モデルが自動生成したフィクション記事を公開
2020年11月21日

あるAnonymous Coward 曰く、
英食品基準庁 (FSA) のスーザン・ジェブ理事長が個人的な見解として、職場にケーキを持っていくのは同僚に受動喫煙させるのと同様に有害と考えるべきだと語っている
(
オーストラリア・シドニーでムエタイを教える男性の言葉を Siri が勘違いし、15 人ほどの警官と数台の救急車がジムに出動する騒ぎとなったそうだ
(
現在のところ有効になっておらず、アナウンスもされていないが、Windows 11 Insider Preview ビルド 25281 で新しい音量ミキサーが発見されている
(
米国務省が各部局に対し、Calibri を標準フォントとして使用するよう通達したそうだ
(
WhatsApp に自分自身とチャットする機能が追加された
(
Meta の監督委員会が Meta に対し、乳首の写真を女性のものだけ投稿禁止するといった現在のコミュニティ基準を見直すよう勧告している
(
先日、
フロッピーディスクの内部のメディアを取り出し、Sony製のミラーレスカメラである「α7 II」の赤外線フィルタとして使うという試みがおこなわれたそうだ。フロッピーディスクのメディア素材を安価な赤外線フィルタとして利用するハックは過去にも存在していたという。このフロッピーディスク素材は可視光線は遮断するが赤外線は透過する。今回の試みでは写真撮影に使われる高価な赤外線フィルターとフロッピーから作り出したフィルタを付けた改造カメラを比較してみようというもの(
headless 曰く、
総務省は17日、有識者会議に格安回線事業者(MVNO)に直接、携帯電話番号を割り振れるようにする電気通信事業法施行規則などの改正案を提示した。現行の制度では、携帯番号を携帯大手4社(MNO)に配分し、格安スマホの提供会社は大手の回線を有償で借り受けている。しかし、MVNO側からは、さまざまなサービスの実現のため自ら携帯電話番号の指定を受けたいという
headless 曰く、
大手メディアなど11社や広告関連のWebDINO Japanらは「オリジネーター・プロファイル(OP)技術研究組合」の設立を発表した。オリジネーター・プロファイル(Originator Profile、以下OP)は、インターネット上で信頼性のあるコンテンツ作成者などを識別する技術とされ、同団体はその実用化を目指すとしている(
アローンは15日、LED内蔵でゲーマー向けとされる冷蔵庫「ALG-GMMFL20L」を販売開始した。机の下などに置ける1ドアタイプのコンパクトサイズなミニ冷蔵庫で、サイズは幅40cm×高さ32.5cm×奥行42cm。容量は20リットル。付属のリモコンで色を変更することができるのが特徴。冷却方式はペルチェ式で、年間消費電力は200kWh。価格は直販では1月31日までは20%OFFのセールが実施中で1万9800円、秋葉原などの店頭では税込みで2万4750円での販売となっている(
Trendfocusのデータによると、2022年はハードディスクの出荷台数がほぼ半減し、容量も前年比で減少する傾向にあったそうだ。一方で、LTO(Linear Tape Open)テープの売上が再び増加する傾向にあるという(