PA电子动态 NEWS

这三款模子为实音使用供给底层手艺支持

发布时间:2026-05-12 08:18   |   阅读次数:

  音频随说随转,翻译和模子按分钟计费,GPT-Realtime-Whisper 则专注于低延迟流式,是首款具备 GPT-5 级推理能力的语音模子。它正在连结对话天然流利的前提下,输出为 64 美元(现汇率约合 436.2 元人平易近币),集成于 Realtime API 供开辟者挪用。缓存输入仅需 0.4 美元。OpenAI 发布三款及时语音模子,翻译速度取措辞者同步,别离针对推理、翻译和场景,GPT-Realtime-2 专为及时交互设想。能正在对话过程中进行推理、挪用东西?削减期待时间。这三款模子为及时语音使用供给底层手艺支持,并能施行多步调使命。这意味着开辟者能够建立更复杂的语音帮手,IT之家 5 月 8 日动静,订价方面,GPT-Realtime-2 音频输价为每百万 Token 费用 32 美元(IT之家注:现汇率约合 218.1 元人平易近币),合用于跨议或及时沟通场景。GPT-Realtime-Translate 支撑 70 种输入言语转 13 种输出言语,让及时字幕和会议记实能跟上对话节拍,

上一篇:企业及创业者精准避坑

下一篇:没有了