#1 - 2022-10-4 20:17
宿星雨
说明:通过对bangumi番组计划的所有用户与条目的公开信息进行采集,尝试建立除了小组文章、讨论版与日志外的bangumi量化信息数据库 ,具体数据格式会在下面给出。
本数据采集旨在对bgm各种纬度的统计学分析提供量化上的支持、借此加深对bgm变化与性质以及互联网评分社区的机制的研究。

基于go语言与postgres数据库采集,数据格式如下:
table1 收藏

table2 用户

table3  条目


样例文件:
链接:https://pan.baidu.com/s/14G863SXRzHdaLMaJ96fD2A
提取码:X469


v1.1已经更新:完全修复用户注册时间数据

下载节点一 百度网盘  xlsx和sql两种格式提供  
链接:https://pan.baidu.com/s/1OlO3AigTvOpTdLGL6SHZPw
提取码:8tVa

其他下载方式以后再补吧 暂时不会更新了

更新修复重大错误:

由于上一版本加密算法部分更改导致两个表加密算法不一致,用户唯一id不一致。现在已经修复。

找回重要丢失数据:

感谢机房、找到了于29日前官方API部分异常错误发生前忘记备份的数据:用户注册时间数据大部分已经找回,还差3.5w。collection找回原有的12m,经过于后期新加入数据去重 现有15.9m 距离官方总collection新计算数额19.52m还差距约4m条,usertotal已修复

参考:魔法少女小圆现在共19655条rate 本数据库提供17492条rate

经过这一个版本的更新、终于可以算是名副其实的第一个正式版了。
总collection数量已经达到了官方公开总collection的80%以上。

下一个版本将尽量做到实时跟进。

本版本暂时仅提供SQL格式
//由于打包错误 还是xlsx格式 明天修复

下载节点1 百度网盘
链接:https://pan.baidu.com/s/1RJHGJo-5dL4rhG7YFsGXMQ
提取码:E5A4

后期添加更多下载方式
#2 - 2022-10-4 20:26
(bgm35)版本号增加的速度比我的只因儿充血的速度还快
#2-1 - 2022-10-4 22:13
红炉点雪
来点黄油高手给阿肥卖点拔作安利
#2-2 - 2022-10-4 22:16
[已注销]
红炉点雪 说: 来点黄油高手给阿肥卖点拔作安利
这么想看bgm被ddos是吧
#3 - 2022-10-4 21:13
真nm逆天啊
#4 - 2022-10-4 22:07
(‮ ‮))))))))))))))))))))))))))))))))‮)
感谢分享 谢谢谢谢谢大佬
#4-1 - 2022-10-4 22:53
宿星雨
这是什么网站,我没什么印象了、可能这个并不是我
还有、无关的评论最好别发在这里。
#5 - 2022-10-6 01:26
(好想穿越去二次元)
比较在意subject_view的数据,不过感觉该表的数据还是有点乱,比如动画都没有分类什么的。
#5-1 - 2022-10-6 07:33
宿星雨
可以按subject_type 和 tag 检索
#5-2 - 2022-10-6 08:03
宿星雨
还有一个type是动漫内部分类编号 、具体数字对应含义可以看看官方api
#5-3 - 2022-10-11 00:11
漫步ACG
宿星雨 说: 还有一个type是动漫内部分类编号 、具体数字对应含义可以看看官方api
subject_type没找到,tag是用户自己添加的标签吧?太乱了。type倒是不错,不过API我只找到了https://bangumi.github.io/api/,没有需要的信息。
#5-4 - 2022-10-14 15:18
宿星雨
漫步ACG 说: subject_type没找到,tag是用户自己添加的标签吧?太乱了。type倒是不错,不过API我只找到了https://bangumi.github.io/api/,没有需要的信息。
就是这里 拉到下面打开subject看看参数含义
话说你看文档都不看完整的么。。
#5-5 - 2022-10-16 02:08
漫步ACG
宿星雨 说: 就是这里 拉到下面打开subject看看参数含义
话说你看文档都不看完整的么。。
看到了,在最后面,多谢提醒(bgm72)
#6 - 2023-5-7 17:34
(谁不知世界的空虚,谁便是空虚的人)
十分感谢,正好个人在研究社交网络部分,想要研究一下这些番剧在站内的传播情况,你的这些数据帮助很大
#6-1 - 2023-5-7 23:33
宿星雨
其实官方在我弄出这个之后出了一个新feature,数据透视   在每个条目里
具体的数据名目和我这个差不多
只是没有提供整个数据打包  
所以也就不打算更新了
#6-2 - 2023-5-7 23:56
萧天
宿星雨 说: 其实官方在我弄出这个之后出了一个新feature,数据透视   在每个条目里
具体的数据名目和我这个差不多
只是没有提供整个数据打包  
所以也就不打算更新了
其实只要大多数的条目数据在,用个脚本跑一遍比调用省事,可能还需要处理,还是原始数据好用