豆包上线实时视频通话功能,结合视觉理解模型提供深度互动

导读5月23日消息,IT之家从豆包公众号获悉,豆包今日宣布在App端上线全新的实时视频通话功能。用户只需在“打电话”界面点击视频按钮,即可开启视频通话,进行基于真实场景的问答互动。比如,用户在旅行途中可以通过该功能询问自己所处景点的历史背景、特色内容或路线规划等问题。

5月23日消息,IT之家从豆包公众号获悉,豆包今日宣布在App端上线全新的实时视频通话功能。用户只需在“打电话”界面点击视频按钮,即可开启视频通话,进行基于真实场景的问答互动。比如,用户在旅行途中可以通过该功能询问自己所处景点的历史背景、特色内容或路线规划等问题。

这一功能背后由豆包最新的视觉理解模型提供支持,能够将视觉与语言输入结合,进行深度思考与创作。此外,豆包的视频通话功能还接入了联网搜索,能够实时获取互联网的最新信息,以进一步提高对话的准确性和时效性。基于图像信息,豆包的视觉理解模型还可以完成如解微积分题、分析论文图表、诊断代码问题等复杂任务,为用户提供多种挑战性任务的解决方案。