图像识别

共 21 篇网址

排序

发布更新浏览点赞

Torii Image Translator

Torii Image Translator是一款浏览器插件，能够让用户在浏览网页时，直接翻译网页上的图片中的文字。它通过集成先进的翻译技术，如GPT-4，提供高精度和上下文理解的翻译服务。这款插件支持多种语言，使用户能够无缝地理解和获取全球各种语言的视觉内容。Torii Image Translator的主要优点包括无缝集成、高质量的翻译、用户友好的界面和增强的全球连通性。它适合那些需要跨越语言障碍获取信息的用户，无论是探索外国文化、进行国际研究还是满足好奇心。

0580

智能翻译 # GPT-4 # 图像识别 # 多语言支持

AI应用导航网

打赏赞微海报分享

0520

一为导航导航网站 # AI # AI applications # AIGC

AISEO AI ART Generator

create stunning images from text prompts using artificial intelligence. AISEO provides the best Ai art generator to bring your visual game to the next level.使用AISEO艺术，您可以描绘自己的想象力。

0470

AI智能绘画 AI赋能 # 3D角色设计 # AISEO # AISEO AI ART Generator

DevMind AI

DevMind AI旨在无缝整合文本、图像、视频、音频和代码等多种模型的推理能力，帮助您像专业人士一样进行开发！DevMind AI通过AI功能增强您的项目。

0450

音频处理 # 图像识别 # 多模态 # 文本分析

百度识图

百度识图通过图像识别和检索技术，为你提供全网海量、实时的图片信息；你可以通过上传，粘贴图片网址等方式寻找目标图片的高清大图，相似美图；通过猜词了解和认知图片内容（如花卉、宠物、名人等）；百度识图还拥有全网检索的人脸技术，帮你找到最相似的人脸。

0410

效率工具 # 以图搜图 # 以图搜图在线识别 # 图像检索

Aquila-VL-2B-llava-qwen

Aquila-VL-2B模型是一个基于LLava-one-vision框架训练的视觉语言模型（VLM），选用Qwen2.5-1.5B-instruct模型作为语言模型（LLM），并使用siglip-so400m-patch14-384作为视觉塔。该模型在自建的Infinity-MM数据集上进行训练，包含约4000万图像-文本对。该数据集结合了从互联网收集的开源数据和使用开源VLM模型生成的合成指令数据。Aquila-VL-2B模型的开源，旨在推动多模态性能的发展，特别是在图像和文本的结合处理方面。

0400

文案写作 # 图像识别 # 多模态 # 文本生成

AIAS

AIAS(AI Acceleration Suite)提供SDK,引擎,标版组件,套装组件加速算法在各业务场景中落地,为集成商赋能,为企业内部项目赋能.

0390

AI在线工具 AI赋能 # AI # AI中台 # Java SDK

Sensifai

Sensifai是一家提供语音识别、图像识别和视频人工智能应用和API解决方案的公司，可以帮助您的机器人理解周围环境、实时识别物体和场景，并进行内容合规和智能监控。

0360

AI记忆助手其它AI工具 # 图像识别 # 视频人工智能

在线图片文字识别转换

打赏赞微海报分享

0360

在线工具文字工具 # pdf识别 # pdf转word # 图像识别

Analyze your Photos Free Online

**使用我们的免费在线工具分析您的照片，Photo Rater AI**！，识别对象并发现隐藏的细节。今天就释放你照片的全部潜能。

0330

AI效率办公 AI赋能 # AI绘画 # 图像处理 # 图像识别

知存科技

专注研发基于存算一体先进技术的人工智能芯片

0300

AIGC开发平台 AI基础设施 # AI芯片 # AI降噪 # SoC芯片

Apple Create ML

Create ML是一款用于在Mac上创建和训练自定义机器学习模型的工具，支持图像分类、目标检测、手势识别、动作分类、文本分类、声音分类和运动分类等功能。

0300

商业AI 生产效率 # 图像识别 # 机器学习

Cubox

Cubox是一款专为深度阅读与学习设计的智能工具，利用先进的人工智能技术自动解读文章内容，充分释放用户在高亮标 […]

0300

AI办公工具 AI工具导航 # AI # annotation # bookmark

DeepSeek-VL2-Tiny

DeepSeek-VL2是一系列先进的大型混合专家（MoE）视觉语言模型，相较于前代DeepSeek-VL有显著提升。该模型系列在视觉问答、光学字符识别、文档/表格/图表理解、视觉定位等多项任务中展现出卓越的能力。DeepSeek-VL2由三种变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2，分别拥有1.0B、2.8B和4.5B激活参数。DeepSeek-VL2在激活参数相似或更少的情况下，与现有的开源密集型和基于MoE的模型相比，达到了竞争性或最先进的性能。

0290

图像生成 # 图像识别 # 多模态理解 # 混合专家

Pirate Diffusion

最好的免费AI图片生成器是Pirate Diffusion。可笑的强大--免费AI图片生成器--最好的AI图片生成器，敢于比较。

0280

AI智能绘画 AI赋能 # AI # AI绘画 # Pirate Diffusion

智谱AI绘画

智谱AI绘画可根据用户的描述创作出新的艺术作品，还能够模仿不同的艺术风格，提供个性化的图像编辑和创作服务

0280

AIGC绘画工具 AI绘画工具 # ai绘画工具 # 个性化定制 # 创新工具

Image to excel

Image to excel是一款利用人工智能技术，能够识别图片中的表格和文本，并将其转换为可编辑的Excel文件的工具。它支持多种语言，包括英语、简体中文、繁体中文、法语等，并且能够识别多种图像格式，如JPG、PNG等。该工具通过AI技术提供高精度和准确性，支持网页、iOS应用和Android应用，用户可以在线将图片转换为Excel。产品背景信息显示，它是一个小型AI工具，旨在帮助用户轻松地将图片数据转换为电子表格，提高工作效率。目前，该工具提供免费试用，具体价格和定位信息未在页面中明确说明。

0270

办公助手 # AI转换 # Excel文件 # 图像识别

AnyParser Pro

AnyParser Pro 是由 CambioML 开发的一款创新的文档解析工具，它利用大型语言模型（LLM）技术，能够快速准确地从 PDF、PPT 和图像文件中提取出完整的文本内容。该技术的主要优点在于其高效的处理速度和高精度的解析能力，能够显著提高文档处理的效率。AnyParser Pro 的背景信息显示，它是由 Y Combinator 孵化的初创公司 CambioML 推出的，旨在为用户提供一种简单易用且功能强大的文档解析解决方案。目前，该产品提供免费试用，用户可以通过获取 API 密钥来访问其功能。

0250

图像生成 # pdf # PPT # 图像识别

Journey.io

输入一个图片提示和你想链接的任何URL，我们将生成一个美丽的生成艺术QR码。

0220

AI设计工具 AI赋能 # AI绘画 # Journey.io # 人工智能绘画

Chance AI

Chance AI是一款AI驱动的视觉搜索引擎，旨在通过先进的视觉智能技术，让用户能够通过视觉内容与世界互动。该技术可以识别艺术品、产品设计、建筑、宠物、行星、肖像和摄影等，揭示图像背后的故事，使视觉体验更加有意义和易于获取。Chance AI的使命是改变跨行业的视觉效果参与方式，通过AI技术提供个性化的新闻、展览、活动和书籍推荐，而不使用算法影响用户所见内容。

0210

艺术创作 # AI # 个性化推荐 # 图像识别

Valley-Eagle-7B

Valley-Eagle-7B是由字节跳动开发的多模态大型模型，旨在处理涉及文本、图像和视频数据的多种任务。该模型在内部电子商务和短视频基准测试中取得了最佳结果，并在OpenCompass测试中展现出与同规模模型相比的卓越性能。Valley-Eagle-7B结合了LargeMLP和ConvAdapter构建投影器，并引入了VisionEncoder，以增强模型在极端场景下的性能。

0200

文案写作 # 图像识别 # 多模态 # 大型模型