睿阳知识库 睿阳知识库
首页
  • npm库配置
  • PC端

    • npm常用命令
    • vue问题记录
    • SEO基础知识及优化
    • 禁止别人调试我的前端页面代码
  • 移动端

    • 小程序
    • Risun.js使用说明
  • Java

    • Maven库配置
    • RSP开发框架
    • RSP框架插件
  • .NET

    • Nuget库配置
  • Python

    • Pypi库配置
  • 常见问题

    • Word转Pdf字体错乱
    • 使用Jacob进行Word导出PDF
  • 自动部署
  • 前端带路径
  • Linux

    • 应用部署
  • Windows

    • 应用部署
  • 视频监控
  • MySQL系列~
  • 应用高可用
  • 静态代码扫描
  • OpenSSH版本升级
  • 区块链~
  • 软件过程文档目录
  • 著作权申请须知及申报示例
  • 项目申报技巧
  • 项目竣工资料清单
  • 科技项目申报流程及注意事项
  • 初级职称申报
  • 产品需求文档基础知识
  • 产品经理需了解的技术知识
  • 墨刀原型设计指南
  • 文档规范
  • 文档规范
  • 投标工作总结(一)
  • 科技项目申报心得体会
  • 数字孪生
  • AI
  • RSP基础平台
  • RMCloud
  • 区块链
  • 网络态势感知
  • 国产化
  • 数据湖
  • 贡献度
  • 文档编写说明
  • Markdown教程
工作链接
首页
  • npm库配置
  • PC端

    • npm常用命令
    • vue问题记录
    • SEO基础知识及优化
    • 禁止别人调试我的前端页面代码
  • 移动端

    • 小程序
    • Risun.js使用说明
  • Java

    • Maven库配置
    • RSP开发框架
    • RSP框架插件
  • .NET

    • Nuget库配置
  • Python

    • Pypi库配置
  • 常见问题

    • Word转Pdf字体错乱
    • 使用Jacob进行Word导出PDF
  • 自动部署
  • 前端带路径
  • Linux

    • 应用部署
  • Windows

    • 应用部署
  • 视频监控
  • MySQL系列~
  • 应用高可用
  • 静态代码扫描
  • OpenSSH版本升级
  • 区块链~
  • 软件过程文档目录
  • 著作权申请须知及申报示例
  • 项目申报技巧
  • 项目竣工资料清单
  • 科技项目申报流程及注意事项
  • 初级职称申报
  • 产品需求文档基础知识
  • 产品经理需了解的技术知识
  • 墨刀原型设计指南
  • 文档规范
  • 文档规范
  • 投标工作总结(一)
  • 科技项目申报心得体会
  • 数字孪生
  • AI
  • RSP基础平台
  • RMCloud
  • 区块链
  • 网络态势感知
  • 国产化
  • 数据湖
  • 贡献度
  • 文档编写说明
  • Markdown教程
工作链接
  • 数字孪生

  • AI

    • AI进度
    • 成果
      • 端口定义
  • RSP

  • RMCloud

  • 区块链

  • 网络态势感知

  • 国产化

  • 数据湖

  • 技术创新
  • AI
张靖
2023-08-25
目录

成果

# 端口定义

1,audio 语音

7001    src/audio/PP-TTS                文本合成语音,只支持中文,TODO:放出声优参数,至少三种 男、女、小孩
7002    src/audio/PP-ASR                语音转文本,只支持中文

2,cv 计算机视觉

7005    src/cv/PP-Matting               人像抠图、换背景
7008    src/cv/PP-Vehicle               车辆识别、车牌识别
7009    src/cv/PP-YOLOv2                目标检测、火灾/烟雾/人脸/人体等分割
7010    src/cv/PP-PicoDet               目标检测、路面危害检测
7011    src/cv/PP-TinyPose              目标检测、关键点检测、动作分类、人体姿态评估
7012    src/cv/PP-YOLOE+                目标检测、通用、雾天行人车辆检测
7013    src/cv/PP-LiteSeg               图像分割、缺陷检测、语义分割
7014    src/cv/PP-HumanSegV2            图像分割
7015    src/cv/PP-HumanV2               人体检测、关键点检测、行为识别、摔倒检测、打架识别、进出管理
7016    src/cv/PP-TSM                   视频内容分类

https://github.com/PaddlePaddle/PaddleClas
pip install -r requirements.txt
python setup.py install
7017    src/cv/clas/app_drink           瓶装饮料,213种瓶装饮料
7018    src/cv/clas/app_104flowers      花卉识别,104种花细分类识别
7019    src/cv/clas/app_vechicles       交通工具,9种交通工具粗分类识别,包括车、船等,TODO:自行车、摩托车索引错了要修改
7020    src/cv/clas/app_fashion         时尚商品,23种时尚商品识别,包括首饰、挎包、化妆品等
7021    src/cv/clas/app_animal          动物识别,90种动物识别,包括斑马、羚羊等
7022    src/cv/clas/app_balls           球类识别,26种球型物体识别,包括弹珠、足球等
7023    src/cv/clas/app_sports          体育运动,100种运动图像识别
7024    src/cv/clas/app_bird            鸟类识别,400种各种姿态的鸟细分类识别
7025    src/cv/clas/app_shoes           鞋子识别,6种鞋子识别,包括靴子、足球鞋等
7026    src/cv/clas/app_boat            轮船识别,6种船种类识别,包括游轮、帆船等
7027    src/cv/clas/app_shoes           宝可梦精灵识别,150种宝可梦神奇宝贝识别,包括皮卡丘、喷火龙等
7028    src/cv/clas/app_veg200          蔬菜识别,116种蔬菜识别,包括菠菜、胡萝卜、玉米等
7029    src/cv/clas/app_adi             航拍场景,30种航拍场景识别,如机场、火车站等
7030    src/cv/clas/app_butterfly       蝴蝶识别,75种蝴蝶细分类识别
7031    src/cv/clas/app_dog             狗类识别,69种狗细分类识别,包括柴犬等
7032    src/cv/clas/app_garbage12       垃圾分类,12种垃圾分类识别
7033    src/cv/clas/app_gemstones       宝石识别,27种宝石识别,包括萤石、翡翠等
7034    src/cv/clas/app_music           乐器识别,30种不同乐器种类识别
7035    src/cv/clas/app_paris           巴黎建筑,11个巴黎建筑识别,如:巴黎铁塔、圣母院等
7036    src/cv/clas/app_treenuts        坚果识别,10种坚果种类识别,包括开心果、核桃、腰果等
7037    src/cv/clas/app_weather         天气识别,10种天气场景识别,如:雨天、打雷、下雪等
7038    src/cv/clas/app_wild_edible     野外植物,32种野外可食植物识别,包括雏菊、蒲公英等
7039   src/cv/pulc/app_person_exists    是否有人检测
7040   src/cv/pulc/app_car_exists       是否有车检测
7041   src/cv/pulc/app_lang_clas        语言分类检测
7042   src/cv/pulc/app_person_attr      人体属性识别
7043   src/cv/pulc/app_safety_helmet    佩戴安全帽检测
7044   src/cv/pulc/app_traffic_sign     交通标志分类
7045   src/cv/pulc/app_vehicle_attr     车辆属性检测
7046   src/cv/pulc/app_textimg_orie     含文本图像方向检测
7047   src/cv/pulc/app_textline_orie    文本行方向检测
7048   src/cv/face/face_detection/app_opancv.py     人脸检测 opencv
7049   src/cv/face/face_detection/app_dlib.py       人脸检测 dlib
7050   src/cv/extended_training/app.py  自定义数据集扩展训练识别

https://github.com/PaddlePaddle/PaddleDetection
pip install -r requirements.txt
python setup.py install
pip install pycocotools


****    src                             TODO:需要GPU环境
        https://github.com/PaddlePaddle/PaddleGAN
        python setup.py develop
        https://github.com/PaddlePaddle/PaddleGAN/blob/develop/docs/en_US/tutorials/video_super_resolution.md
        https://blog.csdn.net/weixin_42334396/article/details/124687307

3,OCR 文本检测

7003    src/ocr/PP-OCRv3        通用文本图像识别抽取
7004    src/ocr/PP-StructureV2  版面恢复                    TODO:

4,nlp 自然语言处理

7006    src/nlp/ERNIE-UIE       关系抽取、事件抽取、评论观点抽取、快递单信息抽取、上市公司信息抽取、情感分类、命名实体识别
7007    src/nlp/ERNIE-Layout    文档分析、发票抽取问答、海报抽取问答、网页抽取问答、表格抽取问答、试卷抽取问答、中文票据多语种(中简、中繁、英、日、法语)抽取问答

5,数据标记工具

检测分割标定
    
    labelstudio
    https://labelstud.io/
        sudo apt install libpq-dev python3-dev
        conda activate paddle_env
        pip install label-studio
        label-studio start
        label-studio --data-dir /data/data_label_studio

        http://localhost:8080

    Labelme
    https://github.com/wkentaro/labelme
    输出:JSON、VOC、COCO
    多边形分割、语义分割、2D框、线标注、点标注(可用于目标检测,图像分割等任务) 、视频标注

    LabelImg
    https://github.com/heartexlabs/labelImg
    输出:PASCAL VOC、YOLO、CreateML
    支持目标检测任务的数据标注

    CVAT
    https://link.zhihu.com/?target=https%3A//github.com/openvinotoolkit/cvat
    输出:多格式
    免费在线交互式视频和图像分割标注工具

    VOTT
    https://github.com/microsoft/VoTT
    输出:
    微软发布的一款基于JavaScript开发用于图像目标检测的标注工具,使用React+Redux进行开发,支持Windows和Linux平台运行。软件还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式,能大幅减轻标注所需的工作量。

    EISeg
    https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.6/EISeg
    输出:
    EISeg(Efficient Interactive Segmentation)基于飞桨开发的一个高效智能的交互式分割标注软件。它涵盖了通用、人像、遥感、医疗、视频等不同方向的高质量交互式分割模型。 另外,将EISeg获取到的标注应用到PaddleSeg提供的其他分割模型进行训练,便可得到定制化场景的高精度模型,打通分割任务从数据标注到模型训练及预测的全流程。
    高效的半自动标注工具,已上线多个Top标注平台
    覆盖遥感、医疗、视频、3D医疗等众多垂类场景
    多平台兼容,简单易用,支持多类别标签管理

    RITM
    https://github.com/SamsungLabs/ritm_interactive_segmentation
    输出:
    用于基于点击的交互式分割,该模型使用了预训练推理模型输出的分割掩码,它不仅可以分割一个全新的对象,还可以从外部mask开始并对其进行校正;

多传感器标定

    OpenCalib
    https://github.com/PJLab-ADG/SensorsCalibration
    商汤开源的工具包,支持camera、lidar、imu、radar之间的标定:
    标定工具支持棋盘格、圆形、方形等方式!
    
3D检测标定
    
    point-cloud-annotation-tool
    https://github.com/springzfx/point-cloud-annotation-tool
    主要用于标定3D点云中目标的box信息,支持导出KITTI格式和Apollo 3D格式!

    annotate
    https://github.com/Earthwings/annotate
    基于ROS框架标定,生成3D检测框,xyz和whl信息;

    3D BAT
    https://github.com/walzimmer/3d-bat
    可以用于标定汽车、卡车、摩托车、自从车、行人等3D目标,支持任何大于10个点的目标标注!
    
    SUSTechPOINTS
    https://github.com/naurril/SUSTechPOINTS
    9自由度框编辑、对象类型/ID/属性编辑、交互式/自动长方体拟合、批处理模式编辑、透视/投影视图编辑、多个摄像头图像,可自动切换摄像头、点云数据的二进制/pcd文件、Jpg/png图像文件、对象/框/点着色、聚焦模式,隐藏背景,轻松查看细节、流播放/停止、对象ID生成

3D点云分割标定

    semantic-segmentation-editor
    https://github.com/Hitachi-Automotive-And-Industry-Lab/semantic-segmentation-editor
    基于web的一款工具,支持图像和点云格式,用于2D和3D数据的分割标注!

6,数据集

CV类大型数据集:

    数据集   	        数据量	        类别数	        场景	        数据集地址
    Aliproduct	        2498771	        50030	        商品	        https://retailvisionworkshop.github.io/recognition_challenge_2020/
    GLDv2   	        1580470	        81313	        地标	        https://github.com/cvdfoundation/google-landmark
    VeRI-Wild	        277797	        30671	        车辆	        https://github.com/PKU-IMRE/VERI-Wild
    LogoDet-3K	        155427	        3000	        商标	        https://github.com/Wangjing1551/LogoDet-3K-Dataset
    SOP	                59551	        11318	        商品	        https://cvgl.stanford.edu/projects/lifted_struct/
    Inshop  	        25882	        3997	        服装	        http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html
    bird400             58388	        400 	        鸟类	        https://www.kaggle.com/datasets/gpiosenka/100-bird-species
    104flows	        12753	        104 	        花类	        https://www.robots.ox.ac.uk/~vgg/data/flowers/102/
    Cars     	        58315	        112 	        车辆	        https://ai.stanford.edu/~jkrause/cars/car_dataset.html
    FashionProduct      44441	        47  	        衣服	        https://www.kaggle.com/datasets/paramaggarwal/fashion-product-images-dataset
    花朵识别  	        24123	        59  	        花类	        https://www.kaggle.com/datasets/aymenktari/flowerrecognition
    food-101	        101000	        101 	        西餐	        https://data.vision.ee.ethz.ch/cvl/datasets_extra/food-101/
    fruits-262	        225639	        262 	        水果	        https://www.kaggle.com/datasets/aelchimminut/fruits262
    inaturalist	        265213	        1010	        自然动植物	https://github.com/visipedia/inat_comp/tree/master/2017#Data
    indoor-scenes   	15588	        67  	        室内场景类型	https://www.kaggle.com/datasets/itsahmad/indoor-scenes-cvpr-2019
    Products-10k    	141931	        9691	        电商	        https://products-10k.github.io/
    CompCars	        16016	        431             车辆      	http://detrac-db.rit.albany.edu/
    BDD100K             100000          /               道路目标      https://bdd-data.berkeley.edu/
    UA-DETRAC           8250            4               车辆跟踪      http://detrac-db.rit.albany.edu/
    CompCars            136726          5               车辆属性      http://mmlab.ie.cuhk.edu.hk/datasets/comp_cars/index.html
    Stanford Cars       16,185          196             车辆分类      http://ai.stanford.edu/~jkrause/cars/car_dataset.html
    VRID                10000           10              车辆属性      http://www.openits.cn/opendata4/748.jhtml
    N-CARS              12,336          /               汽车分类      https://www.prophesee.ai/dataset-n-cars/
    MIT DriveSeg        /               12              道路目标      https://agelab.mit.edu/driveseg
    KITT                /               /               自动驾驶      http://www.cvlibs.net/datasets/kitti/
    CityScapes          /               /               自动驾驶      https://www.cityscapes-dataset.com/
    Comma.ai            /               /               自动驾驶      https://github.com/commaai/research
    Udacity 's          /               /               自动驾驶      https://github.com/udacity/self-driving-car/tree/master/datasets
    D²-City             /               /               车辆检测      https://outreach.didichuxing.com/d2city/
    ApolloScape         /               /               车辆跟踪      http://apolloscape.auto/inpainting.html
    nuScenes            /               /               自动驾驶      https://www.nuscenes.org/
    Robotcar            /               /               车辆检测      https://robotcar-dataset.robots.ox.ac.uk/
    Vehicle             /               /               车尾-分类     http://www.gti.ssr.upm.es/data/Vehicle_database.html?spm=5176.100239.0.0.XGJd1k
    Traffic-Sign        100000          30000           交通标识      https://cg.cs.tsinghua.edu.cn/traffic-sign/


UCI数据集
    http://archive.ics.uci.edu/ml/datasets.php

Kaggle竞赛数据集
    https://www.kaggle.com/datasets

ImageNet
    http://image-net.org/

VisualData
    https://www.visualdata.io/

MS COCO
    http://mscoco.org/

Stanford CoreNLP
    http://nlp.stanford.edu/sentiment/code.html

IMDB
    http://ai.stanford.edu/~amaas/data/sentiment/

Sentiment140
    http://help.sentiment140.com/for-students/

HotspotQA
    https://hotpotqa.github.io/

Enron Email
    https://www.cs.cmu.edu/~./enron/

Amazon
    https://snap.stanford.edu/data/web-Amazon.html

百度Apolloscapes
    http://apolloscape.auto/

Berkeley DeepDrive
    http://bdd-data.berkeley.edu/

Robotcar
    http://robotcar-dataset.robots.ox.ac.uk/

Data.gov
    https://www.data.gov/

Food Environment Atlas
    https://catalog.data.gov/dataset/food-environment-atlas-f4a22

Annual Survey of School System Finances
    https://catalog.data.gov/dataset/annual-survey-of-school-system-finances

NCES
    https://nces.ed.gov/

Data USA
    http://datausa.io/

中国国家统计局
    http://www.stats.gov.cn/

Quandl
    https://www.quandl.com/

WorldBank
    https://data.worldbank.org/

IMF
    https://www.imf.org/en/Data

Markets
    https://markets.ft.com/data/

Google Trends
    http://www.google.com/trends?q=google&ctab=0&geo=all&date=all&sort=0

US Macro Regional
    https://research.google.com/audioset/

2000 HUB5 English
    https://catalog.ldc.upenn.edu/LDC2002T43

LibriSpeech
    http://www.openslr.org/12/

PhysioNet
    https://physionet.org/

scikit-learn中的数据集
    sklearn.datasets.load_<name>:自带数据集(数据量较小)
    sklearn.datasets.fetch_<name>:在线下载的数据集
    sklearn.datasets.make_<name>:生成指定类型的随机数据集
    sklearn.datasets.load_svmlight_file:svmlight/libsvm格式的数据集
    sklearn.datasets.fetch_mldata:mldata.org在线下载数据集

7,pip 安装源

创建环境
conda create -n paddle_env python=3.10    

激活环境
conda activate paddle_env

查看
conda config --show-sources

添加指定源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

删除所有源
conda config --remove-key channels

删除指定的源
conda config --remove-key channels https://pypi.douban.com/simple/

安装指定包
conda install xxx(包名)

移除指定包
conda remove xxx(包名)

更新指定包
conda update xxx(包名)

阿里云:https://mirrors.aliyun.com/pypi/simple
豆瓣:https://pypi.douban.com/simple
腾讯:http://mirrors.tencentyun.com/pypi/simple
python:https://pypi.python.org/simple/
AI进度
RSP进度

← AI进度 RSP进度→

最近更新
01
vue问题记录
10-11
02
RSP进度
10-09
03
贡献度
09-28
更多文章>
Copyright © 2014-2025 甘肃睿阳科技有限公司 陇ICP备15001783-1号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式