首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#视频

AIGC已经不是未来,而是现在:2025年最值得关注的6大趋势!

用户11295429

过去一年,AIGC(AI 生成内容)从“概念”彻底走向“落地”。无论你是程序员、产品经理、内容创作者,甚至是业余爱好者,AIGC 已经渗透到每一...

300

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

机器之心

长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算...

700

250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人

机器之心

它还配备了一对机械臂,人类可以通过一副装有芯片的专用手套远程控制它。HopeJR 的机械臂可以模拟手套佩戴者的动作。Hugging Face 分享的一段演示视频...

1000

SSM+扩散模型,竟造出一种全新的「视频世界模型」

机器之心

在这个 AI 技术与应用大爆发的时代,我们最不缺的就是「热词」,从自回归到扩散模型,从注意力机制到状态空间模型,从思维链到推理模型…… 有时候,其中一些热词会聚...

300

MOT从此“会思考”!华科重磅发布ReaMOT:赋予MOT推理能力,精准理解复杂指令!

AiCharm

研究团队从 12 个现有的多目标跟踪数据集中筛选出适合 ReaMOT 任务的视频序列,这些数据集涵盖了多种场景和目标类别。采用了一种巧妙的三步标注流程,充分结合...

800

Cloud Studio 社区创作者激励计划,免费机时领不完

CloudStudio

对于愿意与CS社区共同成长的朋友,只需在小红书、B站、抖音、公众号、视频号等任意自媒体渠道推荐或分享CS社区的原创/官方内容及体验,单篇内容一经审核通过⚠即刻馈...

600

重磅!支持纯血鸿蒙!腾讯视频ovCompose跨平台框架发布

腾讯开源

随着纯血鸿蒙的推出,客户端跨平台需求被推到了前所未有的高度,单纯的 UI 跨端已无法满足业务诉求,构建Android/iOS/鸿蒙平台的全跨端APP能够最大幅度...

4000

混元语音数字人模型,开源!

腾讯开源

这一能力来自5月28日腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实...

500

HTML 视频(Videos)播放

西里网

HTML5 引入了 <video> 元素,用于在网页中嵌入视频内容,无需使用插件如 Flash。现代浏览器都支持 HTML5 视频播放。

1200

项目推荐:LivePortrait - 让静态照片“活”起来

wayn

LivePortrait 是由 KwaiVGI 团队开发的一项前沿技术,旨在通过深度学习实现高效、逼真的人像动画生成。使得用户能够通过简单的驱动视频或动作模板,...

4110

字节跳动,低调开源!

Ai学习的老章

长期跟踪关注统计学、机器学习算法、深度学习、人工智能、大模型技术与行业发展动态,日更精选技术文章。回复机器学习有惊喜资料。

2910

腾讯云程彬:AI驱动数据进化,构建轻快易用的智能大数据平台(内附完整访谈视频)

腾讯QQ大数据

「数智工匠」是中国信息通信研究院云计算与大数据研究所大数据与智能化部策划的系列访谈栏目,旨在挖掘产业中优秀、前沿数据智能案例,总结数据智能产业经验,让数据智能更...

5910

AI互联下的带宽扩展: 更多波长还是更多光纤?

光学小豆芽

去年Hot Interconnects(HOTI 2024)会议上有一个比较有趣的pannel discussion,主题是"Bandwidth Scaling...

3510

短视频创作要变天?小云雀 AI 让新手也能爆款不断!

程序那些事儿

在短视频创作日益繁荣的时代,内容创作者越来越追求 高效、高质量 的生产方式。剪映 作为知名的视频剪辑软件,已成为许多创作者的必备工具。而随着 小云雀 AI 的推...

4010

AI的风还是吹到了考场,高考AI监考来了!在华裁员3500人,花旗调整技术部门;“韦神”韦东奕入驻抖音 | Q 资讯

深度学习与Python

6 月 6 日,北京大学助理教授韦东奕开设抖音账号并发布了第一条 4 秒的自我介绍视频。视频中,韦东奕表示:“大家好,我是韦东奕,这是我的账号。”

6010

叫板 OpenAI Sora?Manus 推出文生视频服务,计划向所有用户开放

深度学习与Python

近日,Manus AI 推出文本转视频生成服务,可将文本提示转化为全结构化、分镜序列的视频故事。这一功能支持用户通过单条提示完成场景规划、视觉设计与内容动画制作...

1610

深度解读transformers v4.52.4:关键功能升级与实用修复,全方位助力模型开发与优化

福大大架构师每日一题

视频数据处理往往要求对视频帧进行精确分组和排序,才能保证下游模型处理的准确性与效率。在v4.52.4中,新增了基于视频帧数的分组与重新排序功能,使得批量视频处理...

3710

谷歌 AI Studio 实时视频对话终于支持中文了!屏幕共享+语音,Gemini 2.5 Flash 原生音视频加持。

AI进修生

ChatGPT Plus 虽然也有实时视频和屏幕共享功能,但每天使用次数限制比较大,而且只能在手机端使用,实在不太方便。

3600

一张图片+ 一条音频,照片开口说话唱歌,多角色、情绪控制都拿捏了。

AI进修生

他们还提到了长视频生成的方法,用的是一种叫做 Time-aware Position Shift Fusion 的技术,能让模型生成超过 129 帧的视频,减少...

4700

视频讲解|Python图神经网络GNN原理与应用探索交通数据预测

拓端

在数据科学的浩瀚宇宙中,我们如同孜孜不倦的探索者,不断追寻着更高效、精准的数据分析方法。从数据科学家的视角看,数据不仅是一串串数字,更是蕴含着巨大价值的宝藏,等...

5100
领券