Toonflow是什么Toonflow 是开源的一站式 AI 短剧创作工具,将小说、剧本通过多 Agent 协作自动转化为结构化剧本、智能分镜、角色视觉和动画视频,实现小说→剧本→分镜→视频,全流程
BrowserAct Skills是什么BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI 工具,能解决 Agent 操控浏览器时的核心痛点,无 Cookie 环境、
JoyAI-Echo是什么JoyAI-Echo 是京东推出的开源长音视频生成框架,专为分钟级多镜头故事生成设计。框架通过跨模态记忆库、记忆驱动后训练、Director Agent 对话式编辑和轻量化实
Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。模型创新性地采用单纯形旋转编码保证智能体身份对称,配合稀疏枢纽注意力将通信
Qwen-Image-Bench是什么Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度评测各类文生图模型的生成效果,采
PilotDeck是什么PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以WorkSpace为核心设计范式,为每
Hy-Memory是什么Hy-Memory 是腾讯混元推出的专为 OpenClaw 等长期协作型 Agent 设计的记忆插件,通过 6 层记忆框架 × System1/System2 双系统 × 演化
Step 3.7 Flash是什么Step 3.7 Flash 是阶跃星辰面向 Agent 生产化阶段推出的新一代开源 Flash 模型,采用稀疏 MoE 架构,最高生成速度达 400 Tokens/
Aholo Viewer是什么Aholo Viewer是群核科技开源的基于 3D 高斯溅射(3DGS)的高性能 Web 端渲染引擎。工具采用 chunk-level LOD 流式加载技术,让 3D 内
LLM Council是什么LLM Council 是 Andrej Karpathy 开源的多模型协作框架,通过 OpenRouter 将用户问题同时分发给多个大模型(如 Claude、GPT、Ge
陪读蛙是什么陪读蛙(ReadFrog)是开源的 AI 沉浸式翻译浏览器扩展工具。工具能翻译和解读浏览器上的任何内容,支持Chrome、Edge、Firefox。通过上下文感知翻译、划词解析、TTS朗读
FreeLLMAPI是什么FreeLLMAPI 是开源的 OpenAI 兼容代理服务,可将约 14 家 AI 服务商的免费额度聚合为单一 API 端点,每月总计约 13 亿 tokens 的免费推理额