
AI文章
NobodyWho – AI游戏引擎插件,本地运行 LLM 实现互动小说创作
NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需联网即可使用高性能的 LLM 功能,如对话交互和文本生成。
PIKE-RAG – 微软亚洲研究院推出的检索增强型生成框架
PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能解决传统RAG系统在复杂工业应用中的局限性。PIKE-RAG基于提取、理解和应用专业知识,构建连贯的推理逻辑,引导大型语言模型(LLM)生成准确的回答。
Collaborative Gym – 支持人与AI代理实时交互协作的评估框架
Collaborative Gym(Co-Gym)是专注于人机协作(Human-Agent Collaboration)的框架,支持人类与AI代理之间的实时交互与协作。通过模拟和真实两种实验条件,支持开发者在受控环境中进行迭代开发,同时能在真实场景中部署和评估协作效果。
TIGER – 清华大学推出的轻量级语音分离模型
TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)是清华大学研究团队提出的轻量级语音分离模型,通过时频交叉建模策略,结合频带切分和多尺度注意力机制,显著提升了语音分离的效果,降低了参数量和计算量。
如何用AI制作哪吒表情包?ComfyUI工作流喂饭级教程
用AI制作表情包真的太香了,以前一套表情包要做好几周,现在分分钟搞定。
接下来给大家分享一下,我用ComfyUI做的最近爆火的哪吒表情包全过程。
NPOA – 开源舆情检测工具,实时监控网络舆情与分析
NPOA 是开源的功能强大的舆情监测工具,可以帮助用户实时监控网络舆情,了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理技术,可以分析大量的网络数据,提供可视化的舆情分析报告。
什么是上下文感知计算(Context-Aware Computing)
上下文感知计算(Context-Aware Computing)是一种智能计算模式,能够识别并理解用户的实时环境、状态和活动,提供个性化和适应性强的服务。上下文感知计算通过分析用户的位置、时间、活动、设备状态等上下文信息,使设备和服务能够智能地响应用户需求,优化用户体验。在智能家居、移动设备、推荐系统等领域有广泛应用。
如何用办公小浣熊2.0免费完成数据分析,浣熊三步法
一眨眼又要过年了,天塌了!令人头大的N个项目分析报告根本写不完啊,有没有一款解救打工人年底汇报材料的AI工具呢?
经过我不断地搜集寻找,终于让我挖到宝啦!
它就是办公小浣熊2.0!
用浣熊三步法(PAW):规划(Plan)、分析(Analyze)、写作(Write),写分析报告效率提升10倍,关键是完全免费!!!
Long-VITA – 腾讯优图联合南大、厦大开源的多模态模型
Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型,能处理超过100万tokens的长文本输入,在短文本任务中表现出色。Long-VITA基于分阶段训练,逐步扩展视觉和语言的上下文理解能力,支持图像、视频和文本的多模态输入。
如何使用腾讯混元视频生成模型,一手实测
鹅厂,终于推出自己的AI视频了——「混元视频模型」。
最近,受邀参加混元视频模型的内测。周末连肝两天,从早肝到晚,肝了累计有300多支视频吧。
先说结论:作为鹅厂交出的第一版(文生视频、5s),总体质量非常高。在指令遵循、动态和画面稳定性、镜头语言、写实质感、物理遵循等方面表现不错,抽卡很少。