全新HuggingFace数据集库发布!带来467种语言的611个文本数据集
新智元报道
新智元报道
来源:Huggingface
编辑:Q
【新智元导读】NLP初创公司 HuggingFace 近日发布新版其Datasets库 v1.2,包括611 个文本数据集,可以下载以准备在一行 python 中使用;涵盖 467 种语言,其中 99 种包含至少 10 个数据集;当使用非常大的数据集时(默认情况下是内存映射),高效的预处理可以使用户摆脱内存限制。
推荐阅读:
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号
随时掌握互联网精彩
随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 总书记要求用好这把“戒尺” 4991003
- 2 以色列对伊朗发动导弹袭击 4979869
- 3 广州天河驾车撞人案罪犯被执行死刑 4820107
- 4 从消博会看消费新趋势 4744395
- 5 抗战烈士墓发现年轻女子照片 4601882
- 6 学生偷外卖被毒死?学校回应 4501604
- 7 以色列称提前通知美国将实施报复 4457699
- 8 特斯拉前员工:入职7天被裁 4370777
- 9 养老保险断缴即清零?不实 4251257
- 10 北京一皇家级四合院4.5亿元起拍 4119665