AI开源项目 | 一五AI导航

AI开源项目

Seaweed APT

Seaweed APT

一个具有突破性的AI工具，通过单步生成技术大幅提升了视频和图像生成的效率，同时保持了高质量的生成效果

Mochi 1

它通过高质量的视频生成、强大的文本提示一致性和先进的技术架构，为用户提供了强大的视频生成能力

JoyHallo

一个功能强大的数字人模型，专注于普通话和英语的音频驱动视频生成。它通过优化模型结构和数据集支持，实现了高效的跨语言生成能力，并在推理速度和准确性上表现出色

Reflection 70B

Reflection 70B

https://reflection-playground-production.up.railway.app/

Swarm

Swarm是一个由OpenAI解决方案团队管理的教育框架，旨在探索轻量级、易于使用的多智能体编排技术。

Fluid

一个创新的文本到图像生成模型，通过使用连续标记和随机生成顺序，显著提高了图像生成的质量和性能

AtomoVideo

一个创新的图像到视频生成框架，它通过先进的技术和灵活的架构，为用户提供了一种从静态图像生成高保真视频的新方法

OpenVoice

一个强大的即时语音克隆工具，具有精确的音色克隆、灵活的风格控制和零样本跨语言克隆等优势

DreaMoving

一个强大的视频生成框架，通过其创新的Video ControlNet和Content Guider，实现了对视频内容的高度控制

CosyVoice2.0

CosyVoice2.0

先进的语音合成模型，通过其低延迟、高准确性和强稳定性的特点，为用户提供高质量的语音合成体验

Clapper

一个创新的AI视频创作工具，它通过提供一个交互式和直观的创作平台，降低了视频制作的门槛

EasyAnimate

EasyAnimate

基于Transformer架构的视频生成工具，提供了高效、灵活的视频生成解决方案

FunAudioLLM

FunAudioLLM

由阿里巴巴集团通义语音团队开发的框架，旨在增强人类与大型语言模型（LLMs）之间的自然语音交互

NotebookLlama

NotebookLlama

Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现，用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成

RMBG-2.0

由BRIA AI推出的一款下一代图像背景移除模型，它基于创新的BiRefNet架构，能够在复杂环境中提供高精度的背景移除结果

VideoDoodles

VideoDoodles

一个极具创意和实用性的工具，它将手绘艺术与视频编辑相结合，为视频创作者提供了一种全新的表达方式

GameNGen

由谷歌推出的世界首个完全由AI驱动的游戏引擎，旨在颠覆传统的游戏开发方式。这个引擎利用神经网络实时生成游戏画面，无需手动编写代码

Unique3D

个创新的单图像 3D 网格生成工具，以其高保真度、高效训练和优化以及强泛化能力脱颖而出

Seed-VC

一个创新的声音转换工具，它通过零样本学习技术，能够在不需要特定目标音色样本的情况下实现高质量的声音转换

EchoMimic

一款创新的音频驱动肖像动画生成工具，它通过结合音频和面部地标信息，能够生成逼真、自然的肖像动画

STranslate

一款实用的翻译和OCR工具，以其即用即走的特点、开源免费的优势以及社区支持的便利性，为用户提供了高效、便捷的文本处理解决方案

Roop

一个功能强大的换脸工具，以其简单易用和高性能的特点，为用户提供了一种便捷的方式来实现视频中的面孔替换

MaskGCT

一个功能强大的语音合成大模型，它不仅在技术上达到了行业领先水平，还在多语言支持、声音克隆和语音控制等方面表现出色

OmniParser

一个创新的屏幕解析工具，它通过与先进的视觉语言模型结合，显著提升了智能代理在用户界面中的操作能力

F5-TTS

一款功能强大、性能卓越的文本到语音转换工具，通过先进的深度学习技术和创新的架构设计，实现了高质量的语音合成

MinerU

一个功能强大的PDF内容提取工具，通过其多模态内容处理、结构和格式保留、公式识别与转换、干扰元素去除、乱码识别与处理以及高质量解析工具链等主要功能，能够高效地从PDF文档中...

WiseFlow

WiseFlow作为一个开源的AI信息挖掘工具，通过其强大的自动抓取、分类整理和智能处理功能，为用户提供了高效的信息管理解决方案

Tailor

一款集视频剪辑、生成和优化功能于一身的智能视频处理工具，凭借其简单易用的操作方式、强大的功能和智能高效的处理能力

HivisionIDPhotos

HivisionIDPhotos

HivisionIDPhotos是一个功能全面、操作简便的AI证件照制作工具。它不仅能够满足用户对证件照的基本制作需求，还提供了人像抠图、底色添加、排版照生成等高级功能

eSearch

一款综合性的屏幕识别和搜索工具，它通过集成多种实用功能，为用户提供了一个便捷的工作流程，从截图到文本识别，再到信息搜索和翻译，eSearch都能够提供高效的解决方案

1 2 3 4

一五AI导航（15123.cn）是全网收录AI工具最全的导航平台，汇集2000+热门AI工具网址，每日更新最新AI产品，15秒让您找到需要的AI工具，按下Ctrl+D或⌘+D 感谢收藏。

友链申请免责声明关于我们

Copyright©2023-2025 15123.cn