一个开源 Python 库,旨在使开发人员能够使用简单的几行代码构建具有独立深度学习和计算机视觉功能的应用程序和系统。
如果您想赞助这个项目,请访问Github 赞助页面。
我们 ImageAI 的创建者很高兴宣布 2 个新的 AI 项目,在您的个人计算机和服务器上提供最先进的生成式 AI、LLM 和图像理解。
在 PC/Mac 上安装 Jarvis,即可无限制地访问 LLM 支持的 AI 聊天,满足您的日常工作、研究和生成 AI 需求,并具有 100% 隐私和完全离线功能。
请访问https://jarvis.genxr.co开始。
TheiaEngine是下一代计算机视觉 AI API,能够在单个 API 调用中执行所有生成和理解计算机视觉任务,并可通过 REST API 适用于所有编程语言。特点包括
- 检测 300 多个物体(比 ImageAI 多 220 个物体)
- 回答有关图像的
任何内容或上下文问题
- 获取有关任何对象、操作或信息的信息非常有用,无需为每个任务训练新的自定义模型
- 生成场景描述和摘要
- 将 2D 图像转换为 3D 点云和三角网格
- 物体、墙壁、地板等的语义场景映射
- 无状态人脸识别和情绪检测
- 根据提示生成图像和增强图像
- ETC。
请访问https://www.genxr.co/theia-engine尝试演示并立即加入 Beta 测试。
由摩西·奥拉芬瓦开发和维护
ImageAI在构建时考虑到简单性, 支持一系列最先进的机器学习算法,用于图像预测、自定义图像预测、对象检测、视频检测、视频对象跟踪和图像预测训练。ImageAI目前支持使用在 ImageNet-1000 数据集上训练的 4 种不同机器学习算法进行图像预测和训练。ImageAI还支持使用在 COCO 数据集上训练的 RetinaNet、YOLOv3 和 TinyYOLOv3 进行对象检测、视频检测和对象跟踪。最后,ImageAI允许您训练自定义模型来执行新对象的检测和识别。
最终,ImageAI将为计算机视觉更广泛、更专业的方面提供支持
新版本:ImageAI 3.0.2
什么是新的:
- PyTorch 后端
- TinyYOLOv3模型训练
要安装 ImageAI,请在命令行中运行以下 python 安装指令:
-
下载并安装 Python 3.7、Python 3.8、Python 3.9或Python 3.10
-
安装依赖项
-
CPU:下载requirements.txt文件并通过命令安装
pip install -r requirements.txt或者只需复制并运行以下命令
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cpu torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cpu pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3 -
GPU/CUDA:下载requirements_gpu.txt文件并通过命令安装
pip install -r requirements_gpu.txt或只需复制并运行以下命令
pip install cython pillow>=7.0.0 numpy>=1.18.1 opencv-python>=4.1.2 torch>=1.9.0 --extra-index-url https://download.pytorch.org/whl/cu102 torchvision>=0.10.0 --extra-index-url https://download.pytorch.org/whl/cu102 pytest==7.1.3 tqdm==4.64.1 scipy>=1.7.3 matplotlib>=3.4.3 mock==4.0.3
-
-
如果您计划训练自定义 AI 模型,请下载requirements_extra.txt文件并通过命令安装
pip install -r requirements_extra.txt或者只需复制并运行以下命令
pip install pycocotools@git+https://github.com/gautamchitnis/cocoapi.git@cocodataset-master#subdirectory=PythonAPI -
然后运行以下命令安装ImageAI
pip install imageai --upgrade
ImageAI 提供 4 种不同的算法和模型类型来执行图像预测,并在 ImageNet-1000 数据集上进行训练。为图像预测提供的 4 种算法包括 MobileNetV2、ResNet50、InceptionV3 和 DenseNet121。单击下面的链接查看完整的示例代码、说明和最佳实践指南。 |
ImageAI提供了非常方便且强大的方法来对图像进行对象检测并从图像中提取每个对象。对象检测类提供对 RetinaNet、YOLOv3 和 TinyYOLOv3 的支持,并提供调整最先进性能或实时处理的选项。单击下面的链接查看完整的示例代码、说明和最佳实践指南。 |
ImageAI 提供了类和方法,供您训练新模型,该模型可用于对您自己的自定义对象执行预测。您可以使用 MobileNetV2、ResNet50、InceptionV3 和 DenseNet 在 5 行代码中训练自定义模型。单击下面的链接查看准备训练图像、示例训练代码、说明和最佳实践的指南。 |
ImageAI 提供了类和方法,供您使用通过 ImageAI 模型训练类训练的您自己的模型运行图像预测您自己的自定义对象。您可以使用通过 MobileNetV2、ResNet50、InceptionV3 和 DenseNet 训练的自定义模型以及包含自定义对象名称映射的 JSON 文件。单击下面的链接可查看示例培训代码、说明和最佳实践指南的指南。 |
ImageAI 提供了类和方法,供您在自定义数据集上训练新的 YOLOv3 或 TinyYOLOv3 对象检测模型。这意味着您可以通过提供图像、注释和使用 ImageAI 进行训练来训练模型来检测任何感兴趣的对象。单击下面的链接可查看示例培训代码、说明和最佳实践指南的指南。 |
ImageAI 现在提供了类和方法,供您使用通过DetectionModelTrainer 类训练的您自己的模型来检测和识别图像中您自己的自定义对象。您可以使用自定义训练的 YOLOv3 或 TinyYOLOv3 模型以及训练期间生成的 **.json** 文件。单击下面的链接可查看示例培训代码、说明和最佳实践指南的指南。 |
|
我们提供了所有ImageAI类和函数的完整文档。访问以下链接:
- 文档 -英文版 https://imageai.readthedocs.io
ImageAI提供了最先进的计算机视觉技术的抽象且便捷的实现。所有ImageAI实现和代码都可以在任何具有中等 CPU 容量的计算机系统上运行。然而,CPU上的图像预测、目标检测等操作的处理速度较慢,不适合实时应用。要以高性能执行实时计算机视觉操作,您需要使用支持 GPU 的技术。
ImageAI使用 PyTorch 主干进行计算机视觉操作。 PyTorch 支持 CPU 和 GPU(特别是 NVIDIA GPU。您可以为您的 PC 配备一个 GPU,也可以为您的 PC 配备一个)用于机器学习和人工智能算法的实现。
对于任何有兴趣构建人工智能系统并将其用于商业、经济、社会和研究目的的人来说,了解此类技术的使用可能产生的积极、消极和前所未有的影响至关重要。他们还必须了解经验丰富的行业专家推荐的方法和实践,以确保人工智能的每一次使用都为人类带来整体利益。因此,我们建议所有希望使用 ImageAI 和其他 AI 工具和资源的人阅读 Microsoft 2018 年 1 月关于 AI 的出版物,题为“计算的未来:人工智能及其在社会中的作用”。请点击下面的链接下载该出版物。
https://blogs.microsoft.com/blog/2018/01/17/future-compulated-artificial-intelligence-role-society
- 摩西·奥拉芬瓦
- 电子邮件: [email protected]
- 推特: @OlafenwaMoses
- 媒体: @guymodscientist
- 脸书: moses.olafenwa
- 约翰·奥拉芬瓦
- 电子邮件: [email protected]
- 网站: https://john.aicommons.science
- 推特: @johnolafenwa
- 媒体: @johnolafenwa
- 脸书: 奥拉芬瓦约翰
您可以通过下面的BibTeX条目在您的项目和研究论文中引用ImageAI。
@misc {ImageAI,
author = "Moses",
title = "ImageAI, an open source python library built to empower developers to build applications and systems with self-contained Computer Vision capabilities",
url = "https://github.com/OlafenwaMoses/ImageAI",
month = "mar",
year = "2018--"
}
- Somshubra Majumdar,DenseNet 论文《Keras 中的密集连接卷积网络》的实现 https://github.com/titu1994/DenseNet
- 麻省理工学院和哈佛大学布罗德研究所,深度残差网络的 Keras 包 https://github.com/broadinstitute/keras-resnet
- Fizyr,RetinaNet 对象检测的 Keras 实现 https://github.com/fizyr/keras-retinanet
- Francois Chollet,流行深度学习模型的 Keras 代码和权重文件 https://github.com/fchollet/deep-learning-models
- Forrest N. 等人,SqueezeNet:AlexNet 级精度,参数减少 50 倍,模型大小 <0.5MB https://arxiv.org/abs/1602.07360
- Kaiming H. 等人,图像识别的深度残差学习 https://arxiv.org/abs/1512.03385
- 塞格迪。等人,重新思考计算机视觉的初始架构 https://arxiv.org/abs/1512.00567
- 高.等人,密集连接的卷积网络 https://arxiv.org/abs/1608.06993
- 宗毅.等人,密集物体检测的焦点损失 https://arxiv.org/abs/1708.02002
- O Russakovsky 等人,ImageNet 大规模视觉识别挑战赛 https://arxiv.org/abs/1409.0575
- TY Lin 等人,Microsoft COCO:上下文中的常见对象 https://arxiv.org/abs/1405.0312
- 摩西和约翰·奥拉芬瓦,可识别专业人士的图像集。 https://github.com/OlafenwaMoses/IdenProf
- Joseph Redmon 和 Ali Farhadi,YOLOv3:渐进式改进。 https://arxiv.org/abs/1804.02767
- 体验,使用 YOLO3 训练和检测物体 https://github.com/experiencor/keras-yolo3
- MobileNetV2:倒置残差和线性瓶颈 https://arxiv.org/abs/1801.04381
- PyTorch 中的 YOLOv3 > ONNX > CoreML > TFLite https://github.com/ultralytics/yolov3