成果
# 端口定义
1,audio 语音
7001 src/audio/PP-TTS 文本合成语音,只支持中文,TODO:放出声优参数,至少三种 男、女、小孩
7002 src/audio/PP-ASR 语音转文本,只支持中文
2,cv 计算机视觉
7005 src/cv/PP-Matting 人像抠图、换背景
7008 src/cv/PP-Vehicle 车辆识别、车牌识别
7009 src/cv/PP-YOLOv2 目标检测、火灾/烟雾/人脸/人体等分割
7010 src/cv/PP-PicoDet 目标检测、路面危害检测
7011 src/cv/PP-TinyPose 目标检测、关键点检测、动作分类、人体姿态评估
7012 src/cv/PP-YOLOE+ 目标检测、通用、雾天行人车辆检测
7013 src/cv/PP-LiteSeg 图像分割、缺陷检测、语义分割
7014 src/cv/PP-HumanSegV2 图像分割
7015 src/cv/PP-HumanV2 人体检测、关键点检测、行为识别、摔倒检测、打架识别、进出管理
7016 src/cv/PP-TSM 视频内容分类
https://github.com/PaddlePaddle/PaddleClas
pip install -r requirements.txt
python setup.py install
7017 src/cv/clas/app_drink 瓶装饮料,213种瓶装饮料
7018 src/cv/clas/app_104flowers 花卉识别,104种花细分类识别
7019 src/cv/clas/app_vechicles 交通工具,9种交通工具粗分类识别,包括车、船等,TODO:自行车、摩托车索引错了要修改
7020 src/cv/clas/app_fashion 时尚商品,23种时尚商品识别,包括首饰、挎包、化妆品等
7021 src/cv/clas/app_animal 动物识别,90种动物识别,包括斑马、羚羊等
7022 src/cv/clas/app_balls 球类识别,26种球型物体识别,包括弹珠、足球等
7023 src/cv/clas/app_sports 体育运动,100种运动图像识别
7024 src/cv/clas/app_bird 鸟类识别,400种各种姿态的鸟细分类识别
7025 src/cv/clas/app_shoes 鞋子识别,6种鞋子识别,包括靴子、足球鞋等
7026 src/cv/clas/app_boat 轮船识别,6种船种类识别,包括游轮、帆船等
7027 src/cv/clas/app_shoes 宝可梦精灵识别,150种宝可梦神奇宝贝识别,包括皮卡丘、喷火龙等
7028 src/cv/clas/app_veg200 蔬菜识别,116种蔬菜识别,包括菠菜、胡萝卜、玉米等
7029 src/cv/clas/app_adi 航拍场景,30种航拍场景识别,如机场、火车站等
7030 src/cv/clas/app_butterfly 蝴蝶识别,75种蝴蝶细分类识别
7031 src/cv/clas/app_dog 狗类识别,69种狗细分类识别,包括柴犬等
7032 src/cv/clas/app_garbage12 垃圾分类,12种垃圾分类识别
7033 src/cv/clas/app_gemstones 宝石识别,27种宝石识别,包括萤石、翡翠等
7034 src/cv/clas/app_music 乐器识别,30种不同乐器种类识别
7035 src/cv/clas/app_paris 巴黎建筑,11个巴黎建筑识别,如:巴黎铁塔、圣母院等
7036 src/cv/clas/app_treenuts 坚果识别,10种坚果种类识别,包括开心果、核桃、腰果等
7037 src/cv/clas/app_weather 天气识别,10种天气场景识别,如:雨天、打雷、下雪等
7038 src/cv/clas/app_wild_edible 野外植物,32种野外可食植物识别,包括雏菊、蒲公英等
7039 src/cv/pulc/app_person_exists 是否有人检测
7040 src/cv/pulc/app_car_exists 是否有车检测
7041 src/cv/pulc/app_lang_clas 语言分类检测
7042 src/cv/pulc/app_person_attr 人体属性识别
7043 src/cv/pulc/app_safety_helmet 佩戴安全帽检测
7044 src/cv/pulc/app_traffic_sign 交通标志分类
7045 src/cv/pulc/app_vehicle_attr 车辆属性检测
7046 src/cv/pulc/app_textimg_orie 含文本图像方向检测
7047 src/cv/pulc/app_textline_orie 文本行方向检测
7048 src/cv/face/face_detection/app_opancv.py 人脸检测 opencv
7049 src/cv/face/face_detection/app_dlib.py 人脸检测 dlib
7050 src/cv/extended_training/app.py 自定义数据集扩展训练识别
https://github.com/PaddlePaddle/PaddleDetection
pip install -r requirements.txt
python setup.py install
pip install pycocotools
**** src TODO:需要GPU环境
https://github.com/PaddlePaddle/PaddleGAN
python setup.py develop
https://github.com/PaddlePaddle/PaddleGAN/blob/develop/docs/en_US/tutorials/video_super_resolution.md
https://blog.csdn.net/weixin_42334396/article/details/124687307
3,OCR 文本检测
7003 src/ocr/PP-OCRv3 通用文本图像识别抽取
7004 src/ocr/PP-StructureV2 版面恢复 TODO:
4,nlp 自然语言处理
7006 src/nlp/ERNIE-UIE 关系抽取、事件抽取、评论观点抽取、快递单信息抽取、上市公司信息抽取、情感分类、命名实体识别
7007 src/nlp/ERNIE-Layout 文档分析、发票抽取问答、海报抽取问答、网页抽取问答、表格抽取问答、试卷抽取问答、中文票据多语种(中简、中繁、英、日、法语)抽取问答
5,数据标记工具
检测分割标定
labelstudio
https://labelstud.io/
sudo apt install libpq-dev python3-dev
conda activate paddle_env
pip install label-studio
label-studio start
label-studio --data-dir /data/data_label_studio
http://localhost:8080
Labelme
https://github.com/wkentaro/labelme
输出:JSON、VOC、COCO
多边形分割、语义分割、2D框、线标注、点标注(可用于目标检测,图像分割等任务) 、视频标注
LabelImg
https://github.com/heartexlabs/labelImg
输出:PASCAL VOC、YOLO、CreateML
支持目标检测任务的数据标注
CVAT
https://link.zhihu.com/?target=https%3A//github.com/openvinotoolkit/cvat
输出:多格式
免费在线交互式视频和图像分割标注工具
VOTT
https://github.com/microsoft/VoTT
输出:
微软发布的一款基于JavaScript开发用于图像目标检测的标注工具,使用React+Redux进行开发,支持Windows和Linux平台运行。软件还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式,能大幅减轻标注所需的工作量。
EISeg
https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.6/EISeg
输出:
EISeg(Efficient Interactive Segmentation)基于飞桨开发的一个高效智能的交互式分割标注软件。它涵盖了通用、人像、遥感、医疗、视频等不同方向的高质量交互式分割模型。 另外,将EISeg获取到的标注应用到PaddleSeg提供的其他分割模型进行训练,便可得到定制化场景的高精度模型,打通分割任务从数据标注到模型训练及预测的全流程。
高效的半自动标注工具,已上线多个Top标注平台
覆盖遥感、医疗、视频、3D医疗等众多垂类场景
多平台兼容,简单易用,支持多类别标签管理
RITM
https://github.com/SamsungLabs/ritm_interactive_segmentation
输出:
用于基于点击的交互式分割,该模型使用了预训练推理模型输出的分割掩码,它不仅可以分割一个全新的对象,还可以从外部mask开始并对其进行校正;
多传感器标定
OpenCalib
https://github.com/PJLab-ADG/SensorsCalibration
商汤开源的工具包,支持camera、lidar、imu、radar之间的标定:
标定工具支持棋盘格、圆形、方形等方式!
3D检测标定
point-cloud-annotation-tool
https://github.com/springzfx/point-cloud-annotation-tool
主要用于标定3D点云中目标的box信息,支持导出KITTI格式和Apollo 3D格式!
annotate
https://github.com/Earthwings/annotate
基于ROS框架标定,生成3D检测框,xyz和whl信息;
3D BAT
https://github.com/walzimmer/3d-bat
可以用于标定汽车、卡车、摩托车、自从车、行人等3D目标,支持任何大于10个点的目标标注!
SUSTechPOINTS
https://github.com/naurril/SUSTechPOINTS
9自由度框编辑、对象类型/ID/属性编辑、交互式/自动长方体拟合、批处理模式编辑、透视/投影视图编辑、多个摄像头图像,可自动切换摄像头、点云数据的二进制/pcd文件、Jpg/png图像文件、对象/框/点着色、聚焦模式,隐藏背景,轻松查看细节、流播放/停止、对象ID生成
3D点云分割标定
semantic-segmentation-editor
https://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor
基于web的一款工具,支持图像和点云格式,用于2D和3D数据的分割标注!
6,数据集
CV类大型数据集:
数据集 数据量 类别数 场景 数据集地址
Aliproduct 2498771 50030 商品 https://retailvisionworkshop.github.io/recognition_challenge_2020/
GLDv2 1580470 81313 地标 https://github.com/cvdfoundation/google-landmark
VeRI-Wild 277797 30671 车辆 https://github.com/PKU-IMRE/VERI-Wild
LogoDet-3K 155427 3000 商标 https://github.com/Wangjing1551/LogoDet-3K-Dataset
SOP 59551 11318 商品 https://cvgl.stanford.edu/projects/lifted_struct/
Inshop 25882 3997 服装 http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html
bird400 58388 400 鸟类 https://www.kaggle.com/datasets/gpiosenka/100-bird-species
104flows 12753 104 花类 https://www.robots.ox.ac.uk/~vgg/data/flowers/102/
Cars 58315 112 车辆 https://ai.stanford.edu/~jkrause/cars/car_dataset.html
FashionProduct 44441 47 衣服 https://www.kaggle.com/datasets/paramaggarwal/fashion-product-images-dataset
花朵识别 24123 59 花类 https://www.kaggle.com/datasets/aymenktari/flowerrecognition
food-101 101000 101 西餐 https://data.vision.ee.ethz.ch/cvl/datasets_extra/food-101/
fruits-262 225639 262 水果 https://www.kaggle.com/datasets/aelchimminut/fruits262
inaturalist 265213 1010 自然动植物 https://github.com/visipedia/inat_comp/tree/master/2017#Data
indoor-scenes 15588 67 室内场景类型 https://www.kaggle.com/datasets/itsahmad/indoor-scenes-cvpr-2019
Products-10k 141931 9691 电商 https://products-10k.github.io/
CompCars 16016 431 车辆 http://detrac-db.rit.albany.edu/
BDD100K 100000 / 道路目标 https://bdd-data.berkeley.edu/
UA-DETRAC 8250 4 车辆跟踪 http://detrac-db.rit.albany.edu/
CompCars 136726 5 车辆属性 http://mmlab.ie.cuhk.edu.hk/datasets/comp_cars/index.html
Stanford Cars 16,185 196 车辆分类 http://ai.stanford.edu/~jkrause/cars/car_dataset.html
VRID 10000 10 车辆属性 http://www.openits.cn/opendata4/748.jhtml
N-CARS 12,336 / 汽车分类 https://www.prophesee.ai/dataset-n-cars/
MIT DriveSeg / 12 道路目标 https://agelab.mit.edu/driveseg
KITT / / 自动驾驶 http://www.cvlibs.net/datasets/kitti/
CityScapes / / 自动驾驶 https://www.cityscapes-dataset.com/
Comma.ai / / 自动驾驶 https://github.com/commaai/research
Udacity 's / / 自动驾驶 https://github.com/udacity/self-driving-car/tree/master/datasets
D²-City / / 车辆检测 https://outreach.didichuxing.com/d2city/
ApolloScape / / 车辆跟踪 http://apolloscape.auto/inpainting.html
nuScenes / / 自动驾驶 https://www.nuscenes.org/
Robotcar / / 车辆检测 https://robotcar-dataset.robots.ox.ac.uk/
Vehicle / / 车尾-分类 http://www.gti.ssr.upm.es/data/Vehicle_database.html?spm=5176.100239.0.0.XGJd1k
Traffic-Sign 100000 30000 交通标识 https://cg.cs.tsinghua.edu.cn/traffic-sign/
UCI数据集
http://archive.ics.uci.edu/ml/datasets.php
Kaggle竞赛数据集
https://www.kaggle.com/datasets
ImageNet
http://image-net.org/
VisualData
https://www.visualdata.io/
MS COCO
http://mscoco.org/
Stanford CoreNLP
http://nlp.stanford.edu/sentiment/code.html
IMDB
http://ai.stanford.edu/~amaas/data/sentiment/
Sentiment140
http://help.sentiment140.com/for-students/
HotspotQA
https://hotpotqa.github.io/
Enron Email
https://www.cs.cmu.edu/~./enron/
Amazon
https://snap.stanford.edu/data/web-Amazon.html
百度Apolloscapes
http://apolloscape.auto/
Berkeley DeepDrive
http://bdd-data.berkeley.edu/
Robotcar
http://robotcar-dataset.robots.ox.ac.uk/
Data.gov
https://www.data.gov/
Food Environment Atlas
https://catalog.data.gov/dataset/food-environment-atlas-f4a22
Annual Survey of School System Finances
https://catalog.data.gov/dataset/annual-survey-of-school-system-finances
NCES
https://nces.ed.gov/
Data USA
http://datausa.io/
中国国家统计局
http://www.stats.gov.cn/
Quandl
https://www.quandl.com/
WorldBank
https://data.worldbank.org/
IMF
https://www.imf.org/en/Data
Markets
https://markets.ft.com/data/
Google Trends
http://www.google.com/trends?q=google&ctab=0&geo=all&date=all&sort=0
US Macro Regional
https://research.google.com/audioset/
2000 HUB5 English
https://catalog.ldc.upenn.edu/LDC2002T43
LibriSpeech
http://www.openslr.org/12/
PhysioNet
https://physionet.org/
scikit-learn中的数据集
sklearn.datasets.load_<name>:自带数据集(数据量较小)
sklearn.datasets.fetch_<name>:在线下载的数据集
sklearn.datasets.make_<name>:生成指定类型的随机数据集
sklearn.datasets.load_svmlight_file:svmlight/libsvm格式的数据集
sklearn.datasets.fetch_mldata:mldata.org在线下载数据集
7,pip 安装源
创建环境
conda create -n paddle_env python=3.10
激活环境
conda activate paddle_env
查看
conda config --show-sources
添加指定源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
删除所有源
conda config --remove-key channels
删除指定的源
conda config --remove-key channels https://pypi.douban.com/simple/
安装指定包
conda install xxx(包名)
移除指定包
conda remove xxx(包名)
更新指定包
conda update xxx(包名)
阿里云:https://mirrors.aliyun.com/pypi/simple
豆瓣:https://pypi.douban.com/simple
腾讯:http://mirrors.tencentyun.com/pypi/simple
python:https://pypi.python.org/simple/