生成AIを使って書いた記事、盗用で謝罪 専門家「技術以前の問題」
ウェブメディアが生成AI(人工知能)を使って書いた記事が、他の報道機関の記事からの盗用だったとして、公開が取り消された。ChatGPT(チャットGPT)に使われている言語モデルをベースに作ったシステムを用いていたという。急速に広がるAIの活用。今回の問題は「氷山の一角」という懸念もある。
「剽窃・盗用に該当」
「既存の記事にフリーライドしたものであり、新たな価値や見解、議論などを生み出しておらず、社会的・倫理的に問題があることは言うまでもありません」。
ウェブメディア「The HEADLINE」は9月15日、自社サイトに謝罪文を掲載し、8月18~23日に公開した49本の記事の公開を取り消したことを明らかにした。これまでに生成AIを使って作成した全ての記事だという。
このうち15本は、出典を明記しないまま、既存の記事と「一字一句同一の記述が25文字以上連続して確認」されたとして、「明らかな盗用・剽窃(ひょうせつ)を確認できる」と発表した。このほかの多数の記事でも、記事の構造や情報の取捨選択などに類似性が認められたという。
このメディアは昨年1月に始まり、「政治や経済、テクノロジー、社会問題などのニュースをわかりやすく解説するメディア」と掲げる。石田健編集長によると、スタッフは10人弱で、多くがエンジニア。編集者は数人だという。
最初に盗用がわかったのは、8月22日に公開された、大手建設会社が都内に建てる大型ビルの竣工(しゅんこう)が遅れていることを伝える記事。記事の末尾に、開発途中のAIによって生成された記事であると付記していたという。
公開翌日、日本経済新聞と日経クロステックの記事と酷似していると日経側から指摘を受け、「剽窃・盗用に該当すると言える」と認めた。
日経新聞社は朝日新聞社の取材に対し、両者の記事1本ずつが被害にあったと説明し、「今後の対応を検討中」とコメントした。
他に盗用が発覚した記事については、The HEADLINEの運営会社は、内容を明らかにしていない。
この生成AIは、どんな仕組みだったのか。
石田編集長の説明によると…