テキスト、音声、画像を入出力可能生成AI(人工知能)「ChatGPT」開発で知られるOpenAI(オープンAI)は13日、GPT-4oと呼ばれる新しいAIモデルをリリースした。本物の人間のように聞こえる、抑揚ある音声会話が可能であり、テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の様々な形式で応答を出力することができる。ユーザーによる音声入力には、わずか約0.2~0.3秒程度で反応する。これは人間の会話における反応速度と同程度だ。また、ChatGPTが話している間にさえぎ...
おすすめの記事