京东推出全球首个全栈实时视频交互开源框架,拓展实景 AI 应用边界

财闻 2026-06-22 21:31:46

一个好的AI 助手,不应该一直打扰用户,而应该知道什么时候该出现,什么时候该安静,以及什么时候自己解决,什么时候交由agent解决。

一场火灾发生的瞬间,监控系统可以实时发出警报;独居老人在家摔倒,AI可以马上提醒远方的亲人;视障人士外出,智能眼镜随时解读附近环境、指明方向……这些看似科幻的场景,在AI时代可能很快会成为现实。

近日,京东开源实时视频视觉语言交互模型JoyAI-VL-Interaction,这也是全球首个全栈开源的interaction模型和系统,并获得vLLM-Omni的day-0原生支持。它让大模型从“一问一答”走向“边看边说”,开发者基于这套框架,可以快速搭建能持续观察、自主判断、即时响应的实景AI助手,有望推动AI在物理世界发挥巨大作用,为人类生产和生活带来全新变革。

不止看懂过去,更要看懂“现在”

今天很多多模态模型,重在比拼参数、知识和推理,本质上仍是“一问一答”,即用户上传图片或视频,提出问题,模型再给出回答。这种方式在图文问答、视频复盘、内容分析等场景中足够好用,但当AI进入真实世界,模型不只要聪明,更要“在场”。正在发生的真实世界,无数瞬息万变的时刻,错过就很难补救。

京东开源的JoyAI-VL-Interaction,就是让AI像人一样持续“在场”:边看、边记、边判断,并在关键时刻主动回应,或选择性地交接给后台Agent。相比传统模型,JoyAI-VL-Interaction有三重突破:

1、主动判断,而非被动回答。传统模型通常要等用户发起问题,才开始处理当前画面,而JoyAI-VL-Interaction可以持续观察视频流,自主判断什么时候该说话,什么时候该沉默。

比如用户设置“裁判出示红牌时提醒我”,模型就会持续值守画面,并在事件发生时自动预警,而不是等用户再问一句“刚才发生了什么”。

2、实时响应,而非事后总结。传统视频理解更多是上传完整视频后再分析,但在安防预警、实时翻译、直播解说、操作指导等场景里,晚几秒,体验和价值都会不同。而JoyAI-VL-Interaction面向正在发生的视频流,画面变化时就能响应。

3、适时智能体委托,同时保持观察和交互。JoyAI-VL-Interaction还具备后台任务委派能力与相关机制。当模型遇到生成代码、调用工具、复杂推理等任务时,可以交给后台大模型或Agent。前台模型继续观察现场,后台模型处理复杂任务,结果返回后再自然接回对话。它更像一套“前台实时助手+后台智能大脑”的协作系统:前台负责在场,后台负责干重活,有机会开启AI与人类协作的新范式。

开源一套系统,而不只是一个模型

在实时视频流中,JoyAI-VL-Interaction每秒都会做一次判断,比如,继续观察、保持沉默,发现关键事件、主动回应,遇到复杂任务,交给后台Agent处理。这意味着,“什么时候说话”不再只靠外部规则或定时触发,而是成为模型自己学会的能力。

对实时交互来说,会说话很重要,会沉默也同样重要。一个好的AI 助手,不应该一直打扰用户,而应该知道什么时候该出现,什么时候该安静,以及什么时候自己解决,什么时候交由agent解决。

很多开源模型只提供基础推理能力。开发者如果要真正用起来,还需要自己处理视频接入、语音交互、记忆模块、前后端协同等工程问题。JoyAI-VL-Interaction开源的是完整技术栈,包括模型权重、交互数据集、训练方案和完整可部署系统,可以帮助开发者更快从模型研究走向真实场景落地。

JoyAI-VL-Interaction支持摄像头、直播流、监控流等多种视频输入,也支持语音输入输出、可视化界面、长期记忆、后台模型接口和vLLM部署方案。ASR、TTS、可视化界面、后台模型、外部工具和业务模块,都可以按需替换。开发者可以接入自己的语音服务、Agent、API、业务系统或前端界面。

换句话说,JoyAI-VL-Interaction不是封闭产品,而是一套开放框架。它既可以用于研究,也可以改造成安防监控、老人小孩看护、直播讲解、电商导购、操作指导、AI眼镜、无障碍辅助等实时AI助手。

在评测中,JoyAI-VL-Interaction覆盖监控预警、实时计数、实时翻译、时间感知、直播导览解说等真实流式场景。在这些与视觉触发的主动响应、实时性高度相关的58个真人盲评案例中,JoyAI-VL-Interaction对比豆包视频通话助手,总体胜率77.6%;对比Gemini视频通话助手,总体胜率87.9%。尤其在监控预警场景中,对两个基线均取得100%胜率。这源于交互模型相较传统“一问一答”的回合制模型的天然优势:自主交互性长在模型内部,而非依赖外部触发。

从生成到交互,AI走向物理世界

今年以来,京东在模型基建方面取得多项重要进展。3月,京东开源基础大模型JoyAI-LLM Flash的Instruct版本,打破了大模型参数内卷的困局;4月,京东开源图像模型JoyAI-Image-Edit,空间理解与编辑能力达到世界一流水平。6月3日,京东又开源长视频生成模型JoyAI-Echo,推动长视频生成“所想即所得”时代到来,标志着京东在上述领域进入全球第一梯队。

从“一问一答”到“边看边记边回应”,从离线视频理解到实时流式交互,从屏幕里的AI到物理世界里的AI——此次JoyAI-VL-Interaction的全栈开源,是京东把AI从数字世界推向物理世界的又一步。

深耕零售、物流、健康、工业等实体产业二十余年,京东拥有全球领先的物理世界运营网络,覆盖仓储、配送、门店、直播、客服、售后海量真实场景,每天都在发生人、货、场的实时互动。对AI而言,这些不是抽象数据,而是进入物理世界的天然训练场与应用场,为京东打造“全球最大物理世界运营中心”提供坚实的保障。未来京东将持续加大研发投入,开放技术能力,推动AI从千行百业走进千家万户。

实时资讯
更多
2026-06-22 21:37
美股开盘存储板块再度走高:美光涨超5%、英特尔涨超3%
2026-06-22 21:31
京东推出全球首个全栈实时视频交互开源框架,拓展实景 AI 应用边界
2026-06-22 21:31
印度央行4月净卖出89亿美元外汇,黄金储备维持不变
2026-06-22 21:26
美伊就达成最终协议路线图取得一致,两油跌幅持续扩大
2026-06-22 21:24
探路者:公司AI全栈压缩技术可应用于存储系统内部
2026-06-22 21:20
与Anthropic达成内存供应协议,美光盘前涨超5%
2026-06-22 21:17
英伟达发布业界首个全栈物理人工智能安全系统,股价盘前翻红
2026-06-22 21:15
培育钻石再掀涨停潮!AI算力散热困局正催生百亿级新材料风口
2026-06-22 21:14
中通快递:拟13亿元收购TuXi Tech的剩余股份
2026-06-22 21:05
我国成功将纳米颗粒编织成三维光热蒸发材料 实现高效太阳能海水淡化
2026-06-22 21:01
期货夜盘:开盘多数下跌,液化气跌超2%
2026-06-22 21:00
《给阿嬷的情书》官宣延期放映至7月底
2026-06-22 20:50
国产机器人链博会现场展示华尔兹 业内人士:全球具身智能供应链主要在中国
2026-06-22 20:48
比特币重回6.5万美元上方
2026-06-22 20:46
枧下窝锂矿复产消息开盘吓坏A股,尾盘集体翻红,多股晚间齐发公告
2026-06-22 20:26
德龙激光:拟向特定对象发行A股股票募资不超3亿元
2026-06-22 20:26
藏格矿业:收到参股公司巨龙铜业9.23亿元现金分红
2026-06-22 20:25
钨板块集体涨停,机构:预计2026年全球钨供应或延续紧张格局
2026-06-22 20:13
莱茵生物:控股股东终止协议转让及控制权变更事项
2026-06-22 20:12
2连板博云新材:2026年至今未向中钨高新子公司供应高端钻针母材 未向日本佑能出口产品
2026-06-22 21:37
美股开盘存储板块再度走高:美光涨超5%、英特尔涨超3%
2026-06-22 21:31
京东推出全球首个全栈实时视频交互开源框架,拓展实景 AI 应用边界
2026-06-22 21:31
印度央行4月净卖出89亿美元外汇,黄金储备维持不变
2026-06-22 21:26
美伊就达成最终协议路线图取得一致,两油跌幅持续扩大
2026-06-22 21:24
探路者:公司AI全栈压缩技术可应用于存储系统内部
2026-06-22 21:20
与Anthropic达成内存供应协议,美光盘前涨超5%
2026-06-22 21:17
英伟达发布业界首个全栈物理人工智能安全系统,股价盘前翻红
2026-06-22 21:15
培育钻石再掀涨停潮!AI算力散热困局正催生百亿级新材料风口
2026-06-22 21:14
中通快递:拟13亿元收购TuXi Tech的剩余股份
2026-06-22 21:05
我国成功将纳米颗粒编织成三维光热蒸发材料 实现高效太阳能海水淡化
2026-06-22 21:01
期货夜盘:开盘多数下跌,液化气跌超2%
2026-06-22 21:00
《给阿嬷的情书》官宣延期放映至7月底
2026-06-22 20:50
国产机器人链博会现场展示华尔兹 业内人士:全球具身智能供应链主要在中国
2026-06-22 20:48
比特币重回6.5万美元上方
2026-06-22 20:46
枧下窝锂矿复产消息开盘吓坏A股,尾盘集体翻红,多股晚间齐发公告
2026-06-22 20:26
德龙激光:拟向特定对象发行A股股票募资不超3亿元
2026-06-22 20:26
藏格矿业:收到参股公司巨龙铜业9.23亿元现金分红
2026-06-22 20:25
钨板块集体涨停,机构:预计2026年全球钨供应或延续紧张格局
2026-06-22 20:13
莱茵生物:控股股东终止协议转让及控制权变更事项
2026-06-22 20:12
2连板博云新材:2026年至今未向中钨高新子公司供应高端钻针母材 未向日本佑能出口产品
热门文章
日排行 周排行
商务部列10家美实体管控名单,财政部禁采46家美企产品
财闻 06-22
1
证监会主席吴清在2026陆家嘴论坛上的主题演讲(全文)
财闻 06-17
2
存储芯片涨价叠加国产替代,科创芯片ETF易方达涨1.60%
财闻 06-18
3
优必选U1系列17天预售近5000台,人形机器人C端时代来了?
财闻 06-18
4
中国人民银行行长潘功胜在2026陆家嘴论坛上的主题演讲全文
财闻 06-17
5
“超级央行周”落幕:加息阵营扩容,全球资产定价重估
财闻 06-22
6
重磅信号释放!银行、券商股涨疯了,多股逼近涨停
财闻 06-22
7
财闻早知道 | 贷款购买AI相关产品可获贴息支持 2026年新能源汽车下乡活动开启
财闻 06-22
8
资金集体兑现!多只年内大涨半导体个股发布减持公告
财闻 06-22
9
豆包日耗千万收入不足百万
财闻 06-17
10