文章目录
- (1)金融
- (2)交通
- (3)商业
- (4)推荐系统
- (5)医疗健康
- (6)图像数据
- (7)视频数据
- (8)音频数据
- (9)自然语言处理
- (10)社会数据
- (11)处理后的科研和竞赛数据
- (12)运动想象,情绪识别
- (13)其他
(1)金融
- 美国劳工部统计局官方发布数据
- 上证 A 股日线数据,1999.12.09 至 2016.06.08,前复权,1095 支股票
- 深证 A 股日线数据,1999.12.09 至 2016.06.08,前复权,1766 支股票
- 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510 支股票
- MT4 平台外汇交易历史数据
- Forex 平台外汇交易历史数据
- 几组外汇交易逐笔(Ticks)数据
- 美国股票新闻数据【Kaggle 数据】
- 美国医疗保险市场数据【Kaggle 数据】
- 美国金融客户投诉数据【Kaggle 数据】
- Lending Club 网贷违约数据【Kaggle 数据】
- 信用卡欺诈数据【Kaggle 数据】
- 某个金融产品实时交易数据【Kaggle 数据】
- 美国股票数据 XBRL【Kaggle 数据】
- 纽约股票交易所数据【Kaggle 数据】
(2)交通
- 2013 年纽约出租车行驶数据
- Udacity 自动驾驶数据
- 纽约 Uber 接客数据 【Kaggle 数据】
- 英国车祸数据(2005-2015)【Kaagle 数据】
- 芝加哥汽车超速数据【Kaggle 数据】
- KITTI 自动驾驶任务数据【数据太大仅有一部分】
- Cityscapes 场景标注数据【数据太大仅有介绍】
(3)商业
- Amazon 食品评论数据【Kaggle 数据】
- Amazon 无锁手机评论数据【Kaggle 数据】
- 美国视频游戏销售和评价数据【Kaggle 数据】
- Kaggle 各项竞赛情况数据【Kaggle 数据】
- Airbnb 开放的民宿信息和住客评论数据
(4)推荐系统
- Netflix 电影评价数据
- MovieLens 20m 电影推荐数据集
- WikiLens
- Jester
- HetRec2011
- Book Crossing
- Large Movie Review
- Retailrocket 商品评论和推荐数据
(5)医疗健康
- 人识别物体时大脑核磁共振影像数据
- 人理解单词时大脑核磁共振影像数据
- 心脏病心房图像及标注数据
- 细胞病理识别
- FIRE 视网膜眼底病变图像数据
- 食物营养成分数据 【Kaggle 数据】
- EGG 大脑电波形状数据【Kaggle 数据】
- 某人基因序列数据【Kaggle 数据】
- 癌症 CT 影像数据【Kaggle 数据】
- 软组织肉瘤 CT 图像数据【Kaggle 数据】
- 美国国家健康与服务部 - 国家癌症研究所发起的癌症数据仓库介绍【仅有介绍】
- Data Science Bowl 2017 肺癌识别竞赛数据【数据太大仅有介绍】
- TCGA-LUAD 肺癌 CT 图像数据
- RAID 肺癌 CT 图像数据
(6)图像数据
6.1 综合图像
- Visual Genome 图像数据
- Visual7w 图像数据
- COCO 图像数据
- SUFR 图像数据
- ILSVRC 2014 训练数据(ImageNet 的一部分)
- PASCAL Visual Object Classes 2012 图像数据
- PASCAL Visual Object Classes 2011 图像数据
- PASCAL Visual Object Classes 2010 图像数据
- 80 Million Tiny Image 图像数据【数据太大仅有介绍】
- ImageNet【数据太大仅有介绍】
- Google Open Images【数据太大仅有介绍】
6.2 场景图像
- Street Scences 图像数据
- Places2 场景图像数据
- UCF Google Street View 图像数据
- SUN 场景图像数据
- The Celebrity in Places 图像数据
6.3 Web 标签图像
6.4 人形轮廓图像
6.5 视觉文字识别图像
- Street View House Number 门牌号图像数据
- MNIST 手写数字识别图像数据
- 3D MNIST 数字识别图像数据【Kaggle 数据】
- MediaTeam Document 文档影印和内容数据
- Text Recognition 文字图像数据
- NIST Handprinted Forms and Characters 手写英文字符数据
- NIST Structured Forms Reference Set of Binary Images (SFRS) 图像数据
- NIST Structured Forms Reference Set of Binary Images (SFRS) II 图像数据
6.6 特定一类事物图像
- 著名的猫图像标注数据
- Caltech-UCSD Birds200 鸟类图像数据
- Stanford Car 汽车图像数据
- Cars 汽车图像数据
- MIT Cars 汽车图像数据
- Stanford Cars 汽车图像数据
- Food-101 美食图像数据
- 17_Category_Flower 图像数据
- 102_Category_Flower 图像数据
- UCI Folio Leaf 图像数据
- Labeled Fishes in the Wild 鱼类图像
- 美国 Yelp 点评网站酒店照片
- CMU-Oxford Sculpture 塑像雕像图像
- Oxford-IIIT Pet 宠物图像数据
- Nature Conservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle 数据】
6.7 材质纹理图像
6.8 物体分类图像
- COIL-20 图像数据
- COIL-100 图像数据
- Caltech-101 图像数据
- Caltech-256 图像数据
- CIFAR-10 图像数据
- CIFAR-100 图像数据
- STL-10 图像数据
- LabelMe_12_50k 图像数据
- NORB v1.0 图像数据
- NEC Toy Animal 图像数据
- iCubWorld 图像分类数据
- Multi-class 图像分类数据
- GRAZ 图像分类数据
6.9 人脸图像
- IMDB-WIKI 500k+ 人脸图像、年龄性别数据
- Labeled Faces in the Wild 人脸数据
- Extended Yale Face Database B 人脸数据
- Bao Face 人脸数据
- DC-IGN 论文人脸数据
- 300 Face in Wild 图像数据
- BioID Face 人脸数据
- CMU Frontal Face Images
- FDDB_Face Detection Data Set and Benchmark
- NIST Mugshot Identification Database
- Faces in the Wild 人脸数据
- CelebA 名人人脸图像数据
- VGG Face 人脸图像数据
- Caltech 10k Web Faces 人脸图像数据
6.10 姿势动作图像
- HMDB_a large human motion database
- Human Actions and Scenes Dataset
- Buffy Stickmen V3 人体轮廓识别图像数据
- Human Pose Evaluator 人体轮廓识别图像数据
- Buffy pose 人类姿势图像数据
- VGG Human Pose Estimation 姿势图像标注数据
6.11 指纹识别
- NIST FIGS 指纹识别数据
- NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据
- NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指纹识别数据
- NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指纹识别数据
6.12 其它图像数据
(7)视频数据
7.1 综合视频
7.2 人类动作视频
- Microsoft Research Action 人类动作视频数据
- UCF50 Action Recognition 动作识别数据
- UCF101 Action Recognition 动作识别数据
- UT-Interaction 人类动作视频数据
- UCF iPhone 运动中传感器数据
- UCF YouTube 人类动作视频数据
- UCF Sport 人类动作视频数据
- UCF-ARG 人类动作视频数据
- HMDB 人类动作视频
- HOLLYWOOD2 人类行为动作视频数据
- Recognition of human actions 动作视频数据
- Motion Capture 动作捕捉视频数据
- SBU Kinect Interaction 肢体动作视频数据
7.3 目标检测视频
- UCSD Pedestrian 行人视频数据
- Caltech Pedestrian 行人视频数据
- ETH 行人视频数据
- INRIA 行人视频数据
- TudBrussels 行人视频数据
- Daimler 行人视频数据
- ALOV++ 物体追踪视频数据
7.4 密集人群视频
7.5 其它视频
(8)音频数据
8.1 综合音频
8.2 语音识别
- Sinhala TTS 英语语音识别
- TIMIT 美式英语语音识别数据
- LibriSpeech ASR corpus 语音数据
- Room Impulse Response and Noise 语音数据
- ALFFA 非洲语音数据
- THUYG-20 维吾尔语语音数据
- AMI Corpus 语音识别
(9)自然语言处理
- RCV1 英语新闻数据
- 20news 英语新闻数据
- First Quora Release Question Pairs 问答数据
- JRC Names 各国语言专有实体名称
- Multi-Domain Sentiment V2.0
- LETOR 信息检索数据
- Yale Youtube Vedio Text
- 斯坦福问答数据【Kaggle 数据】
- 美国假新闻数据【Kaggle 数据】
- NIPS 会议文章信息数据(1987-2016)【Kaggle 数据】
- 2016 年美国总统选举辩论数据【Kaggle 数据】
- WikiLinks 跨文档指代语料
- European Parliament Proceedings Parallel Corpus 机器翻译数据
- WikiText 英语语义词库数据
- WMT 2011 News Crawl 机器翻译数据
- Stanford Sentiment Treebank 词汇数据
(10)社会数据
- 希拉里邮件门泄露邮件
- 波士顿 Airbnb 公开数据【Kaggle 数据】
- 世界各国经济发展数据【Kaagle 数据】
- 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle 数据】
- 世界范围显著地震数据(1965-2016)【Kaagle 数据】
- 美国婴儿姓名数据【Kaagle 数据】
- 全世界鲨鱼袭击人类数据【Kaagle 数据】
- 1908 年以来空难数据【Kaagle 数据】
- 2016 年美国总统大选数据【Kaagle 数据】
- 2013 年美国社区统计数据【Kaagle 数据】
- 2014 年美国社区统计数据【Kaagle 数据】
- 2015 年美国社区统计数据【Kaagle 数据】
- 欧洲足球运动员赛事表现数据【Kaagle 数据】
- 美国环境污染数据【Kaagle 数据】
- 美国 H1-B 签证申请数据【Kaggle 数据】
- IMDB 五千部电影数据【Kaggle 数据】
- 2015 年航班延误和取消数据【Kaggle 数据】
- 凶杀案报告数据【Kaggle 数据】
- 人力资源分析数据【Kaggle 数据】
- 美国费城犯罪数据【Kaggle 数据】
- 安然公司邮件数据【Kaggle 数据】
- 历史棒球数据【Kaggle 数据】
- 美联航 Twitter 用户评论数据【Kaggle 数据】
- 波士顿 Airbnb 公开数据【Kaggle 数据】
(11)处理后的科研和竞赛数据
- NIPS 2003 属性选择竞赛数据
- 台湾大学林智仁教授处理为 LibSVM 格式的分类建模数据
- Large-scale 分类建模数据
- 几个 UCI 中 large-scale 分类建模数据
- Social Computing Data Repository 社交网络数据
(12)运动想象,情绪识别
-
运动影像数据
-
- Left/Right Hand MI: http://gigadb.org/dataset/100295
- Motor Movement/Imagery Dataset: https://www.physionet.org/physiobank/database/eegmmidb/
- Grasp and Lift EEG Challenge: https://www.kaggle.com/c/grasp-and-lift-eeg-detection/data
- The largest SCP data of Motor-Imagery: https://doi.org/10.6084/m9.figshare.c.3917698
- BCI Competition IV-1: http://www.bbci.de/competition/iv/#dataset1
- BCI Competition IV-2a: http://www.bbci.de/competition/iv/#dataset2a
- BCI Competition IV-2b: http://www.bbci.de/competition/iv/#dataset2b
- High-Gamma Dataset: https://github.com/robintibor/high-gamma-dataset
- Left/Right Hand 1D/2D movements: https://sites.google.com/site/projectbci/
- Imagination of Right-hand Thumb Movement: https://archive.ics.uci.edu/ml/datasets/Planning+Relax
-
情绪识别数据
-
- DEAP: http://www.eecs.qmul.ac.uk/mmv/datasets/deap/
- Enterface’06: http://www.enterface.net/results/
- Imagined Emotion: http://headit.ucsd.edu/studies/3316f70e-35ff-11e3-a2a9-0050563f2612
- NeuroMarketing: https://drive.google.com/open?id=0B2T1rQUvyyWcSGVVaHZBZzRtTms
- SEED: http://bcmi.sjtu.edu.cn/~seed/seed.html
- SEED-IV: http://bcmi.sjtu.edu.cn/~seed/seed-iv.html
- SEED-VIG: http://bcmi.sjtu.edu.cn/~seed/seed-vig.html
- HCI-Tagging: https://mahnob-db.eu/hci-tagging/
- REGULATION OF AROUSAL: https://ieee-dataport.org/open-access/regulation-arousal-online-neurofeedback-improves-human-performance-demanding-sensory
-
误差相关电位 (ErrP)
-
- BCI-NER Challenge: https://www.kaggle.com/c/inria-bci-challenge
- Monitoring ErrP in a target selection task: http://bnci-horizon-2020.eu/database/data-sets
- ErrPs during continuous feedback: https://www-ti.informatik.uni-tuebingen.de/~spueler/eeg_data/contErrP_description.pdf): 10 subjects with 28 EEG electrodes, playing a video game to study execution and outcome error. Dataset Part-1]: https://www-ti.informatik.uni-tuebingen.de/~spueler/eeg_data/Continous_ErrP_dataset_Part1.rar) Dataset Part-2]: https://www-ti.informatik.uni-tuebingen.de/~spueler/eeg_data/Continous_ErrP_dataset_Part2.rar)
- HCI-Tagging: https://mahnob-db.eu/hci-tagging/
-
视觉诱发电位 (VEPs)
-
- c-VEP BCI: https://www-ti.informatik.uni-tuebingen.de/~spueler/eeg_data/cVEP_dataset.rar
- c-VEP BCI with dry electrodes: https://www-ti.informatik.uni-tuebingen.de/~spueler/eeg_data/dry_cVEP_dataset.rar
- SSVEP - Visual Search/Discrimination and Handshake: https://archive.ics.uci.edu/ml/datasets/EEG+Steady-State+Visual+Evoked+Potential+SignalsMore Dataset: Dataset 2: http://www2.hu-berlin.de/eyetracking-eeg/testdata.html
-
事件相关电位 (ERPs)
-
- Pattern Visual Evoked Potentials: https://www2.le.ac.uk/departments/engineering/research/bioengineering/neuroengineering-lab/software
- Face vs. House Discrimination: https://purl.stanford.edu/xd109qh3109
-
休息状态
-
- Resting State EEG Data: https://dataverse.tdl.org/dataverse/txstatecogelectro
- EID-M, EID-S: https://drive.google.com/drive/folders/1t6tL434ZOESb06ZvA4Bw1p9chzxzbRbj
-
音乐与 EEG
-
- Music Imagery Information Retrieval: https://github.com/sstober/openmiir
-
眨眼 / 动作
-
- Involuntary Eye Movements during Face Perception: http://www2.hu-berlin.de/eyetracking-eeg/testdata.html
- Voluntary-Involuntary Eye-Blinks: https://drive.google.com/file/d/0By5iwWd39NblS2tRWmVTdmRzZUU/view?usp=sharing
- EEG-eye state: https://archive.ics.uci.edu/ml/datasets/EEG+Eye+State
- EEG-IO: http://gnan.ece.gatech.edu/eeg-eyeblinks/
- EEG-VV, EEG-VR: http://gnan.ece.gatech.edu/eeg-eyeblinks/
-
其他一些数据集
-
- MNIST Brain Digits: http://mindbigdata.com/opendb/index.html
- Imagenet Brain: http://www.mindbigdata.com/opendb/imagenet.html
- Working Memory: https://github.com/pbashivan/EEGLearn/tree/master/Sample data
- Deep Sleep Slow Osciallation: https://challengedata.ens.fr/challenges/10
- Genetic Predisposition to Alcoholism: https://archive.ics.uci.edu/ml/datasets/EEG+Database
-
临床脑电图
-
- TUH EEG Resources: https://www.isip.piconepress.com/projects/tuh_eeg/html/downloads.shtml
(13)其他
- https://sccn.ucsd.edu/~arno/fam2data/publicly_available_EEG_data.html - http://headit.ucsd.edu/studies
- https://www2.le.ac.uk/departments/engineering/research/bioengineering/neuroengineering-lab/software
- https://github.com/pbashivan/EEGLearn/tree/master/Sample data
- Section 2: https://arxiv.org/pdf/1611.08024.pdf
- EEG Databases for Emotion Recognition, NTU
- https://engineuring.wordpress.com/2009/07/08/downloadable-eeg-data/
- http://www.brainsignals.de/
- http://www.fil.ion.ucl.ac.uk/spm/data/
- http://www.brainliner.jp/search/showall/1
- http://bnci-horizon-2020.eu/database/data-sets
- http://archive.ics.uci.edu/ml/datasets/EEG+Database
- https://www.physionet.org/physiobank/database/#neuro
- http://www.physionet.org/pn6/chbmit/
- https://sites.google.com/site/iitrcsepradeep7/resume
- http://memory.psych.upenn.edu/RAM
- http://fcon_1000.projects.nitrc.org/indi/cmi_eeg/
- https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8616018
- https://arxiv.org/pdf/1805.06427.pdf
- http://www.gtec.at/Research/Biosignal-Data-Sets/content/Biosignal-Data-Sets
- http://studycatalog.org/
- http://predict.cs.unm.edu/
- https://datadryad.org/resource/doi:10.5061/dryad.070jc
- https://ieee-dataport.org/data-competitions
- The Australian EEG Database https://aed.newcastle.edu.au/AED/login.jsp