每日AI资讯-2025年07月10日

每日AI资讯-2025年07月10日

文章来源:智汇AI    发布时间:2025-07-11

2025年7月10日AI领域最新新闻资讯,包括:阿里开源ThinkSound为视频创作者带来音效福音;微软Phi-4-mini让笔记本也能畅玩AI;xAI的Grok4功能强大;AI API市场谷歌霸…

暂无访问

阿里免费放出自家“音效魔术师”ThinkSound,给视频加音效再也不用求人了!

最近阿里通义实验室整了个大活儿——开源了一款叫ThinkSound的AI工具,能自动给视频配音效,简直是内容创作者的福音。

这玩意儿厉害在哪儿?它不光能看懂视频画面,还能听懂你的文字描述。比如你给段森林的视频,它立马能配上鸟叫流水声;给个都市夜景,汽车喇叭和人群喧闹声就来了,而且音画对得特别准,4K视频也能轻松搞定。

最关键的是阿里这次玩真的,直接把模型代码和工具全免费放出来了,在GitHub上就能下。不管你是小工作室还是个人创作者,不用花大价钱请音效师,自己动手就能做出影院级效果。之前阿里开源的模型下载量都超330万次了,这次这个估计也得火。

现在不管是做短视频、拍小电影还是搞游戏开发,用它都能省不少事。以后改音效也方便,直接说话告诉它“把风声调小点儿”就行,简直是把专业录音棚搬回了家。

体验地址:ThinkSound官网入口

微软新出的小模型Phi-4-mini-flash-reasoning太猛了!笔记本也能玩出花

微软刚放出来的Phi-4-mini新版本,简直是为咱们这种手头设备一般的人量身定做的。

这模型厉害就厉害在跑得贼快,比上一版快了10倍,延迟还低了不少,关键是普通笔记本电脑都能带得动。听说里面用了个叫SambaY的新架构,是微软跟斯坦福大学一起搞出来的,处理长文本特别牛,写个几万字的东西也不卡。

最让人惊喜的是它的数学能力,解复杂题的时候步骤清清楚楚,比之前那些模型靠谱多了。测试的时候,处理32K长度的内容,准确率能到78%,甩了同类模型一条街。

微软这次是下了血本,用了5万亿数据训练,还解决了不少技术难题。现在不管是学生写作业,还是研究员做分析,不用非得抱服务器大腿了,自己的平板、笔记本就能搞定,这波操作确实接地气。

详情查看:微软Phi-4-mini-flash-reasoning发布:推理效率飙升10倍,笔记本也能跑AI大模型!

xAI的Grok4来了!写代码查热点样样行

马斯克家的xAI刚发布了Grok4,这模型一出来就被吹成AI界的新标杆。

最牛的是它分了两个版本:一个普通版用来写东西、做研究;另一个叫Grok4Code,专门给程序员用的,写代码、找bug比人还快,有点像给开发者配了个超级助理。

它还有个独门绝技——能实时扒X平台(以前的推特)的最新消息,查热点、追新闻比谁都快。不过之前因为说错过以色列和伊朗的事儿被骂过,这次说是改进了,但还是建议重要信息自己再核实下。

这次发布会是直播的,现场演示解数学题、调代码,看得人眼花缭乱。听说训练的时候用了20万个GPU,比上一代猛了10倍。可惜现在还只能处理文字,图片视频功能得等后续更新。

想试试的话,现在可以通过X的高级会员或者官网体验,就是不知道这“说话直来直去”的风格,大家能不能接受。

体验地址:GrokAI官网入口

2025上半年AIAPI大战:谷歌霸榜,OpenAI有点懵

今年上半年AI接口市场可太热闹了,各家打得头破血流,最新榜单出来,谷歌的Gemini系列直接霸榜了。

Gemini-2.0-Flash卖得最火,主要是便宜,一百万token才0.4美元,响应还快,开发者都爱用。Anthropic的Claude排第二,表现中规中矩。最让人意外的是DeepSeek,免费版加付费版加起来快赶上第二了,性价比是真高。

OpenAI这次有点拉胯,GPT-4o-mini忽高忽低,没稳住阵脚。看来现在大家不光看性能,更看性价比。谷歌这波低价策略玩得溜,DeepSeek靠开源也抢了不少地盘。

有意思的是,第一季度用量暴涨4倍,后来稳定在每周2万亿token,说明市场慢慢成熟了。下半年估计更热闹,价格战肯定少不了,咱们用户等着捡便宜就好。

体验地址:谷歌Gemini官网入口

体验地址:OpenAI网页端入口

体验地址:DeepSeek网页端官网入口

英伟达撑腰的Perplexity推出AI浏览器Comet,敢跟谷歌Chrome叫板

被英伟达投资的PerplexityAI,最近搞了个叫Comet的浏览器,摆明了要跟谷歌Chrome抢饭碗。

这浏览器最神的是内置了AI助手,你正看着网页呢,它能直接回答你关于当前内容的问题,不用再复制粘贴到别处问了。语音指令也支持,比如你说“找黄仁勋演示Perplexity的视频”,它立马就给你找出来。

它还能帮你自动做不少事:总结邮件、规划路线、甚至替你上网预约。有点像给浏览器装了个大脑,比普通浏览器省心多了。

不过现在得花200美元订阅才能先用,后面会慢慢放开。谷歌现在占着68%的市场份额,Perplexity这波能不能撕开个口子不好说,但至少给咱们多了个新选择。

体验地址:AI浏览器Comet

HuggingFace推出ReachyMini桌面机器人,程序员狂喜

做AI开源的HuggingFace,新出了个叫ReachyMini的桌面机器人,现在已经能订了。

这小东西有两个版本:无线版449美元,能直接连RaspberryPi5;精简版299美元,得插电脑用。尺寸跟毛绒玩具差不多,俩屏幕当眼睛,还带天线,组装起来挺有意思。

最关键的是它完全开源,用Python就能编程,还能直接连HuggingFace的平台,里面有170多万个AI模型随便用。开发者可以拿它测试各种AI应用,比如让它识别物体、跟人对话啥的。

老板说做这个是想让更多人玩起来,别让机器人技术被几家大公司垄断了。下个月精简版就能发货,无线版稍晚点,想动手试试的程序员们可以蹲一波。

体验地址:HuggingFace网页版入口

腾讯生肖鹅x混元3D创作大赛,用AI画马年公仔赢奖金

腾讯最近整了个好玩的比赛,用他们家的混元3DAI引擎,设计2026马年的生肖企鹅公仔,得奖了能拿真金白银。

参加方法挺简单:你可以写段文字描述,或者上传图片、画个草图,AI就能帮你生成3D模型。记得要用那个带“活动限定”标签的生肖鹅风格,不然可能通不过审核。

时间从7月8号到27号投稿,之后投票到8月17号。人气前10名给5000块奖金(税后),还有荣誉证书和特别版企鹅公仔;11到30名给腾讯视频年卡。

不过规矩得遵守:必须原创,得有马元素,还得是坐或者站的姿势,不能用太稀奇的材料。要是弄些乱七八糟的内容,直接取消资格。

现在打开腾讯混元3D官网就能参加,不管是业余爱好者还是专业人士,都能试试,万一得奖了呢?

大赛地址:腾讯生肖鹅x混元3D创作大赛入口

速来!北京动画周48小时AIGC动画挑战赛等你“战”

在人工智能火出圈的当下,影视动画创作领域正经历一场大变革,这股风潮也吹到了北京动画周!为响应“推动文化事业和文化产业繁荣发展”的号召,落实数字文化产业高质量发展意见,探索人工智能在文化领域的应用,“北京动画周48小时AIGC原创动画挑战赛”即将激情开赛!

赛事概况

2025年9月北京动画周期间,这场大赛将在北京市西城区北京展览馆热闹开场。活动会先广泛征集作品,然后挑出15支超厉害的AI创作团队,让他们在现场48小时沉浸式创作,给AI创作者们一个闪亮登场的舞台,也给视听行业加点新料。

赛事特色

比赛以北京特色文化命题,团队得在规定时间内完成创作。现场还有AI技术专家、高校学者、业界大咖给参赛团队当“智囊团”。而且,这次挑战赛可不只是比赛,后续还有作品展映、创作分享、学术交流等活动,大家一起聊聊AI、动画和区域文化怎么携手共进。

组织单位

这次活动由中国动画学会、北京市广播电视局、西城区委区政府主办,中国动画学会教育专委会等单位承办,还有华中科技大学设计学院等多家单位协办,平台支持有AITop100等,指导单位是中国广播电视社会组织联合会。

比赛报名

面向社会公开招募,评审团审核后邀请15支团队参赛。每队2-4人,队长得有成熟AI创作经验,有知名AI赛事获奖经历的团队优先。报名截止到2025年9月5日,9月10日会通知入选结果。现场抽签确定命题,团队要在48小时内完成一部不少于90秒的AI动画短片,还得提交竖版和横版海报各一幅。

要是你热爱动画创作,对AI技术超感兴趣,想在创意舞台上大放异彩,就别犹豫,赶紧扫码报名,一起开启这场超刺激的创意之旅!

大赛地址:https://ai.gameba.cc/infomation/details/27829.html

相关推荐