当前位置:文章 > 列表 > 正文

OpenAI最智能语音模型:GPT-Realtime-2登场,GPT-5级推演本领 - 公司

📅 2026-05-17 14:09:51 🏷️ 伦敦国际黄金价格行情 👁️ 263
OpenAI最智能语音模型:GPT-Realtime-2登场,GPT-5级推演本领

GPT-Realtime-Whisper 则专注于低延迟流式转录,音频随说随转,让实时字幕与集会记载能跟上对话节奏,减等待光阴。

翻译与转录模型按分钟计费,分别为每分钟 0.034 美元与 0.017 美元。

GPT-Realtime-Translate 支 70 种输入言辞转 13 种输出言辞,翻译速度与说话者齐步,适用于跨国集会或实时通场景。

GPT-Realtime-Whisper 则专注于低延迟流式转录,音频随说随转,让实时字幕与集会记载能跟上对话节奏,减等待光阴。

此三款模型为实时语音应用提供底层技艺支撑,宗旨处置语音交互中之延迟、打断办理与多言辞支难题。

它于保对话自流畅之先决下,能于对话历程中进行推演、调用器物,并办理用户之打断或纠正。

天气

定价方面,GPT-Realtime-2 音频输入定价为每百万 Token 费用 32 美元(IT之家注:现比价约合 218.1 元者民币),输出为 64 美元(现比价约合 436.2 元者民币),缓存输入仅需 0.4 美元。

IT之家 5 月 8 日消息,OpenAI 发布三款实时语音模型,分别针对推演、翻译与转录场景,集结于 Realtime API 供掘发者调用。

此意味之掘发者可构建更繁之语音助手,并能执行多步骤差事。

翻译与转录模型按分钟计费,分别为每分钟 0.034 美元与 0.017 美元。

GPT-Realtime-2 专为实时交互设计,为首款具备 GPT-5 级推演本领之语音模型。

【文/观察者网 柳白】。

Biotechnology。

上一篇:仰望商研院千者大会深圳启幕,千企精英共探高品质演进路径 下一篇:2025年率队夺冠之他能胜任吗? 勇士选科尔接班者瞄准佛大主帅