メタは「Threads」で生成AI競争に勝とうとしている

メタのマーク・ザッカーバーグが新たなソーシャルメディア「Threads」をローンチした背景には、Xのデータが有料化で手に入りにくくなったタイミングで参入し、AI競争で巻き返しを図りたい思惑があるようだ。
Collage of random letters people racing on a track and ribbons of color
Photo-illustration: WIRED Staff; Getty Images

メタ・プラットフォームズの新たなソーシャルメディア「Threads」は、7月初旬にローンチされると直ぐに「Twitter殺し」の異名をとった。X(旧Twitter)のオーナーであるイーロン・マスクはThreadsを「パクり」だとし、メタを提訴すると発言したほどだ。

同じくメタが運営するInstagramと連動しながらローンチしたThreadsは、Xに非常に似ている。スクロールできるタイムラインがあり、テキストベースで、文字数制限がある。しかし、Xはずっと赤字であることで知られているにもかかわらず、どうしてメタは同様のプラットフォームを開発したのだろうか。最近のメタは「ビデオ重視」の方針に転換し、TikTokと競合しようとしていたはずではなかったか。その答えは、人工知能(AI)と関係しているかもしれない。

人間が生成したデータの価値

ここ数カ月のAIを取り巻く状況は、まさに“覇権争い”といった様相だ。ChatGPT、Midjourney、Stable Diffusion、Copilot、Dall-E、そしてグーグルのBardといったツールが、こぞってユーザーを奪い合っている。多くの企業が生成AIに時間と資金を投資するなか、AIモデルを訓練するために大量のデータが必要とされている。そしてこのデータは、人間が生み出したものでなくてはならない。そうでなくては、人間らしい生成AIをつくることはできないのだ。

RedditやXといったプラットフォームは、何百万というユーザーによって生成されたコンテンツを有しているため、金脈のような存在だ。これまでは、どちらのプラットフォームもこれらのデータを広く公開していた。サードパーティーの開発者や研究者たちにとっては非常にありがたい存在だったのだ。2020年だけを見ても、Xのデータは少なくとも17,000本の学術論文で使われている。

ChatGPTやBardといったAIモデルも、こうしたプラットフォームのデータをもとに訓練されていた。しかし次第に、ユーザーが生成したデータには果たしてどれだけの価値があるのか、第三者がアクセスする際にどれだけの料金を徴収するべきなのか、という疑問が上がるようになった。メタを含めた多くの企業が独自のAIモデル開発に急ぐなか、こうしたデータはいままでほどアクセスしやすいものではなくなるかもしれない。

今年の初め、マスクはXがAPIの使用料として月額42,000ドル(約590万円)の徴収を始めることを発表した。これにより多くの既存ユーザーはAPIを使用できなくなるだろうが、特に影響を受けるのは、いままでXのデータを使ってフェイクニュースなどについて研究していた学者やリサーチャーたちだ。その後、Xは月額125,000ドル(約1,750万円)と210,000ドル(約2,900万円)のプランも発表した。

それからほどなくして、RedditもAPIを有料化すると発表した。ニューヨーク・タイムズのインタビューで、Redditの最高経営責任者であるスティーブ・ハフマンは「Redditがもつコーパスのデータは(AIモデルを訓練するために)非常に価値のあるもの」として認識したうえで、同社が「それだけ価値があるものを、世界で最も巨大ないくつもの企業に無料で提供する必要性を感じない」と語った。

メタにとって絶好のタイミング

ここ数カ月間、マスクはXのデータへのアクセスを厳しく取締り続けている。4月にはマイクロソフトが「違法に」Xのデータを使用してAIモデルの訓練に使ったとツイートした(マイクロソフトはメタや、ChatGPTの開発元であるOpenAIのパートナーだ)。Xの弁護士が公開した文書は、マイクロソフトが許可されている量を超えてXのデータを使用したとしている。

そして6月には、ログインをしなければXのコンテンツが見られないよう制限がかけられた。加えて、1日に600件以上のツイートを見たい場合は有料サービスであるTwitter Blueに登録しなければいけないようになった。マスクはこれを「一時的な緊急対策」としており、「データの略奪」を防ぐためのものだとしている(Xを保有する企業XCorpはその後すぐに、4名の被告を相手に訴訟を起こしている。被告の名は明かされていないが、Xは損害賠償として100万ドルを請求している)。Xへのアクセスを制限する傍ら、マスクは新たにxAIというスタートアップを立ち上げた。xAIのAIモデルはXのデータを使って訓練されることになる。

これがThreadsとどう関係しているのか。メタは、その社名が示している通り、メタバースにその社運を賭けたばかりに、AIへの投資においては遅れをとっている。しかし7月中旬、同社は独自の大規模言語モデル(LLM)であるLlama 2の開発を発表した。このAIモデルはオープンソースで、研究者や企業に無料で提供されることになる(これはLlamaがChatGPTのようにユーザーを管理できないことも意味している。たとえば、利用規約を破ってフェイクニュースを生成したユーザーから利用権を取り上げるといったことができないのだ)。大量のデータを必要としている企業がXに頼れなくなったいま、ThreadsはAI分野におけるメタの巻き返しを加速させるかもしれない。

メタはすでにInstagramやFacebookといったプラットフォームに大量のデータを保有しているが、LLMの訓練には膨大な量のデータが必要になるほか、言語の変化についていくためには、データを常に更新していかなくてはならない。Xのデータが簡単には手に入らなくなったいま、同様のユーザー生成データを入手しようと思ったら、Xそっくりのプラットフォームをつくるのがいいだろうと考えた。さらに言えば、マスクがXにさまざまな変更を加えたことでユーザー離れが起こっており、またBlueSkyMastodonといった競合プラットフォームもXに取って代わるには至っていないので、タイミングとしては絶好だといえる。

Threadsのローンチはメタにとって野心的な動きだが、ほかの小さな競合プラットフォーム弱らせてしまう軽率な一手となるかもしれない。もしくは、同社が生成AIサービスの開発のために必要としているデータを大量に産出する投資になるかもしれない。しかし究極的には、Threadsがユーザーを定着させられるかどうかが重要だ。Threadsのアクティブユーザー数はローンチ時の4,400万から1,300万まで落ち込んでおり、最もアクティブなユーザーのほとんどは企業ブランドとなっている。

しかしTwitterがXへとリブランドするにあたって、どこか新しい場所でフォロワーと交流し、自分のデータを吐き出したいと思っているユーザーもいるだろう。Threadsはまさにそういったユーザーたちを待ち構えているのだ。

WIRED US/Translation by Ryota Susaki/Edit by Mamiko Nakano)

※『WIRED』によるソーシャルメディアの関連記事はこちらThreadsの関連記事はこちら


Related Articles
Half pixellated Llama peeks out of a loop that resembles the Meta logo.
OpenAIの「GPT-4」が急速に広く浸透していくなか、メタは無料で利用できる大規模言語モデル「Llama 2」をオープンソースとして発表した。起業家たちが強力なAIシステムを容易に構築できるようになったことで、生成AI競争はさらに激化しそうだ。
Black and white photo of $100 bills on mouse traps
Twitterを離脱しようとする人たちがBlueskyやThreadsに集まっている。しかしこれらの新たなSNSも、大手プラットフォームがユーザーを敵に回す原因となったパターンを繰り返し、最終的に自身を“窒息”させる運命に陥ってしまうかもしれない。
Reflections of the Threads app and Meta logos
メタ・プラットフォームズがスタートさせた「Threads」は分散型SNSに対応する予定だと発表している。もしメタにユーザーデータを現状のまま収集されたくないのであれば、分散型プロトコルが実装されるまではアカウントはつくらないほうがいいかもしれない。

次の10年を見通す洞察力を手に入れる!
『WIRED』日本版のメンバーシップ会員 募集中!

次の10年を見通すためのインサイト(洞察)が詰まった選りすぐりのロングリード(長編記事)を、週替わりのテーマに合わせてお届けする会員サービス「WIRED SZ メンバーシップ」。無料で参加できるイベントも用意される刺激に満ちたサービスは、無料トライアルを実施中!詳細はこちら