#1 - 2022-10-4 20:17
宿星雨
说明:通过对bangumi番组计划的所有用户与条目的公开信息进行采集,尝试建立除了小组文章、讨论版与日志外的bangumi量化信息数据库 ,具体数据格式会在下面给出。
本数据采集旨在对bgm各种纬度的统计学分析提供量化上的支持、借此加深对bgm变化与性质以及互联网评分社区的机制的研究。
基于go语言与postgres数据库采集,数据格式如下:
table1 收藏
table2 用户
table3 条目
样例文件:
链接:https://pan.baidu.com/s/14G863SXRzHdaLMaJ96fD2A
提取码:X469
v1.1已经更新:完全修复用户注册时间数据
下载节点一 百度网盘 xlsx和sql两种格式提供
链接:https://pan.baidu.com/s/1OlO3AigTvOpTdLGL6SHZPw
提取码:8tVa
其他下载方式以后再补吧 暂时不会更新了
更新修复重大错误:
由于上一版本加密算法部分更改导致两个表加密算法不一致,用户唯一id不一致。现在已经修复。
找回重要丢失数据:
感谢机房、找到了于29日前官方API部分异常错误发生前忘记备份的数据:用户注册时间数据大部分已经找回,还差3.5w。collection找回原有的12m,经过于后期新加入数据去重 现有15.9m 距离官方总collection新计算数额19.52m还差距约4m条,usertotal已修复
参考:魔法少女小圆现在共19655条rate 本数据库提供17492条rate
经过这一个版本的更新、终于可以算是名副其实的第一个正式版了。
总collection数量已经达到了官方公开总collection的80%以上。
下一个版本将尽量做到实时跟进。
本版本暂时仅提供SQL格式
//由于打包错误 还是xlsx格式 明天修复
下载节点1 百度网盘
链接:https://pan.baidu.com/s/1RJHGJo-5dL4rhG7YFsGXMQ
提取码:E5A4
后期添加更多下载方式
本数据采集旨在对bgm各种纬度的统计学分析提供量化上的支持、借此加深对bgm变化与性质以及互联网评分社区的机制的研究。
基于go语言与postgres数据库采集,数据格式如下:
table1 收藏
table2 用户
table3 条目
样例文件:
链接:https://pan.baidu.com/s/14G863SXRzHdaLMaJ96fD2A
提取码:X469
v1.1已经更新:完全修复用户注册时间数据
下载节点一 百度网盘 xlsx和sql两种格式提供
链接:https://pan.baidu.com/s/1OlO3AigTvOpTdLGL6SHZPw
提取码:8tVa
其他下载方式以后再补吧 暂时不会更新了
更新修复重大错误:
由于上一版本加密算法部分更改导致两个表加密算法不一致,用户唯一id不一致。现在已经修复。
找回重要丢失数据:
感谢机房、找到了于29日前官方API部分异常错误发生前忘记备份的数据:用户注册时间数据大部分已经找回,还差3.5w。collection找回原有的12m,经过于后期新加入数据去重 现有15.9m 距离官方总collection新计算数额19.52m还差距约4m条,usertotal已修复
参考:魔法少女小圆现在共19655条rate 本数据库提供17492条rate
经过这一个版本的更新、终于可以算是名副其实的第一个正式版了。
总collection数量已经达到了官方公开总collection的80%以上。
下一个版本将尽量做到实时跟进。
本版本暂时仅提供SQL格式
//由于打包错误 还是xlsx格式 明天修复
下载节点1 百度网盘
链接:https://pan.baidu.com/s/1RJHGJo-5dL4rhG7YFsGXMQ
提取码:E5A4
后期添加更多下载方式
还有、无关的评论最好别发在这里。
话说你看文档都不看完整的么。。
具体的数据名目和我这个差不多
只是没有提供整个数据打包
所以也就不打算更新了