検索巨人 vs AI開発の火花!Baidu、GoogleとBingの内容スクレイピングを禁止へ
- 百度がウェブサービスで防御措置
- GoogleとMicrosoft Bingのアクセスを遮断
- AIトレーニングに利用されるコンテンツ保護が目的
中国のインターネット検索企業百度が、自社の百科事典サービス「百度百科」で重要な更新を実施した。GoogleとMicrosoft Bingがコンテンツをクロールするのを妨げるため、robots.txtファイルを変更したことが注目されている。この変更により、GooglebotとBingbotが百度百科の情報を抽出することが不可能になった。変更が行われたのは8月8日で、Wayback Machineによる記録にもそれが示されている。
人工知能の訓練に使用される情報源としての価値が高まる中、百度は自社サービスが外部のAIトレーニング用データセットにされないよう、このような手段を講じたと考えられる。コンテンツの保護は、データを有効に活用し、独自性を保つ上でも重要な戦略だ。
また、この一連の動きは、テクノロジー業界におけるデータへのアクセス競争が激化していることを象徴している。グローバルな市場で競争優位を保つためには、リソースの管理と保護が不可欠であり、百度はその一線を画した行動を起こしたと言える。百度百科の更新は、同社が自らのデータを守り、事業の核心を独自の手で育てていく意志の表れだ。
GoogleやBingをブロックすることで、
百度にどんなメリットがあるの?
それって結局どういうこと?
全然わかんないんだけど!
はい、私が説明しますね。
**百度**は自社のコンテンツが**GoogleやBing**のAI訓練に使われないように保護しています。自社データの独自性を保ちつつ、他社がそのデータを利用できないようにすることで競争優位を保つ戦略です。
ユータ、簡単に言うと、
**百度**が自分の百科事典サービス「百度百科」の情報を**Google**と**Bing**が使えないようにしたんだ。
これは、外部のAIがその情報を学習するのを防ぐためだ。
そうすることで、百度は自社のデータの独自性を守り続け、
他社が同じデータを使って強くならないようにするということだ。
データの管理と保護は競争力を保つためにとても重要なんですよ。
アヤカが言ったように、これによって百度は競争優位を確保しようとしているわけです。
これで少しは理解できたかな?