Tuesday, September 26, 2023 11:34 AM

オープンAI、チャットGPTに対話機能を追加

 オープンAI(OpenAI)の生成人工知能チャットボット「チャットGPT(ChatGPT)」は、「見て、聞いて、話す」ことができるようになった。少なくとも、話し言葉を理解し、合成音声で応答し、画像を処理できるようになった。

 CNBCによると、オープンAIが9月25日に発表した新機能は、同社がGPT-4(Generative Pre-trained Transformer 4)の導入を発表して以来最大の刷新だ。

 利用者らは新機能によって、チャットGPTのモバイル・アプリケーションで音声会話に参加し、ボットが応答する音声を5種類の合成音声から選ぶことができる。また、利用者とチャットGPTが画像を共有し、利用者の指示によって画像のどこに照準して分析すべきかを理解して実行する。

 同社によると、それらの新機能は今後2週間に有料利用者らに提供される。音声機能はiOSとアンドロイド向けのアプリケーションに限定される。画像処理機能はすべてのプラットフォームで利用できるようになる。

 今回の刷新は、技術業界における生成人工知能機能の開発競争の激化を反映している。マイクロソフトやグーグル、アンスローピック(Anthropic)はこの数ヵ月間に、生成人工知能基盤の機能をあいついで市場投入している。新たな用途(使い方、応用法、機能)を提示することで利用者基盤を拡大し、市場競争を優位にするというのが各社のねらいだ。

 マイクロソフトは、2023年初めにオープンAIに100億ドルを追加投資し、オープンAIの生成人工知能技術を自社製品群に積極的に統合している。グーグルは、チャットGPTに対抗するために独自の生成人工知能チャットボット「バード(Bard)」を構築し、アンスローピックもその対抗製品であるクロード(Claude)を提供している。

 ただ、合成音声と生成人工知能のさらなる融合には懸念も指摘される。専門家らの一部は、より自然の利用体験を一般的利用者らにもたらす一方で、巧妙なディープ・フェイクも可能になる、と警鐘を鳴らす。わずかの音声サンプルから偽の発話内容を合成することで、詐欺や誹謗中傷、サイバー攻撃の手口が進化するおそれがさらに深刻化する。

https://www.cnbc.com/2023/09/25/chatgpt-speak-listen-process-images-openai.html