#1 - 2021-12-17 06:04
GonSenMaD (二次元界acg潜行中……)
因为看了不少条目,标签很多都是乱七八糟的,不管是自己还是别人的,不知道你们有没有遇到过这样的问题:不小心手c标错了却不知道?标签过久忘了,渐渐的发现别人的标签更好用更简单易懂,简繁体字到底要用哪种?(这个问题我现在还是非常纠结)这真是令人困扰的问题,如果能关联合并简繁体字,意思相同的标签的话应该会非常方便,而且搜索时最大最头痛的问题就是简体只能搜索简体的,没法做到简繁一起(这个问题导致我搜索时如果搜不到于是1搜简体2搜繁体3日文或原文,时不时会遇到有些明明用的是相同关键字却搜不到……真是太xx麻烦了!!!),是时候加上这个功能了吧还是因为有什么问题没法……
如高频率出现的相同意思:
jk=女高中生=女子高生=女子校生=女子高生
霓虹=日本=日本动漫=日本动画
恋爱=恋愛=爱情=愛情
轻小说改=小说改=轻改
無修正=无修正=无修=无码=步兵=無码=步兵裡番
时间:2022=2022年=二O二二年=二零二二年
数字:1=一=壹=壱
……总之还有很多不胜枚举,好像有类似的组件?有人开发吗?
我的意思是标签简繁关联合并,就像我列举的一样,并不是统一,就比如一个条目有中文名和别名一样可以用其中一个搜索到
所以实现这个功能的情景是——
1当你搜索时无论简繁都能搜到
2照常用自己的标签标记后系统会自动关联,而显示出来的是自己用的标签,因为标签关联合并了所以就算你不小心标错了(只要意思相同简繁甚至是其他语言都不用去改回来了)这时候显示的标签默认是系统关联合并时统一显示的,也可以设置成显示自己标签名字
3使条目显示更直观了然,显示更多标签,不会因为原来被几个相同意思简繁体标签霸屏但现在已经关联合并不显示的标签而xx
4使自己收藏里标记的标签不繁琐亢长,不会因为多而看着头大
5收藏偏向日本方面的尤其是创作者他们名字有不少都是五花八门的但其中有不少繁体字的要标记简体字标得累因为习惯用简体字,所以这个功能就显得很实用了
6这个功能或组件定义的话是《标签关联合并引擎系统》这样的?如果这个《标签关联合并引擎系统》做出来了肯定要有AI学习功能了,通过ai只要一个条目出现两个相同意思的标签系统就自动关联合并于是只显示默认的标签,但可以设置成显示自己的标记的
#2 - 2021-12-17 08:21
(根据相关法律法规,签名栏未予显示)
难度太大,感觉可能也未必是一个组件就能解决的事情,可能需要 sai 老板在服务端解决。简繁转换还好说,同义词合并就太难了,用枚举一个个对应显得太蠢…可能就要用到 NLP 之类的东西了
#2-1 - 2021-12-17 16:08
#2-2 - 2021-12-17 16:21
GonSenMaD
可乐呀 说: https://github.com/BYVoid/OpenCC
这个是那个平台的插件,只能做到把字体转换,我的意思是bgm平台的组件,把相同意思简繁体标签关联合并,
#2-3 - 2021-12-17 16:27
可乐呀
GonSenMaD 说: 这个是那个平台的插件,只能做到把字体转换,我的意思是bgm平台的组件,把相同意思简繁体标签关联合并,
是,我只是说服务端有轮子可以做性能比较好的简繁转换的。毕竟这玩意也能转大陆台湾同义的不同用语,要在服务端去搞可以用这个,也能合并一部分多余的(
#3 - 2021-12-17 15:43
(bgm38)这个在图书馆信息学里叫规范控制,是个很难搞好的事情,暂时还是不要想了
#4 - 2021-12-17 16:24
(いつでも微笑みを)
轻小说改可不等于小说改
#4-1 - 2021-12-20 00:26
GonSenMaD
这个我明白,只是想“抛砖引玉”一下啊哈哈哈……
#5 - 2021-12-17 16:43
(怠け者)
一是合并同义标签实际操作起来很麻烦,标准也很难把握;
二是这个标签是大家记录收视的时候按自己喜好贴的(有些人说不定有自己的一套标准),然后自动显示在条目详情页,我想大部分人是不希望自己贴的标签被强行统一的。
唯一的办法估计是把条目详情页的标签跟个人记录收视时贴的标签分开,然后编出一份可参照的规范来限制条目详情页的标签内容,但这规范制定起来应该很麻烦(比方说只能下拉选择规定好的标签,但想穷举所有可能的标签是很难的)。
#6 - 2021-12-19 16:26
(渴望着血脉相通 无限个千万弟兄)
合并标签没必要,这种事没有尽头的。

但繁简体字在某些程度上的合并很有必要吧,比如搜索的时候。最好是搜“少女與戰車”也能显示“少女与战车”的结果。豆瓣搜索就做到了搜繁体字也显示对应的简体字结果。
#6-1 - 2021-12-20 00:25
GonSenMaD
你说的意思好像不清楚,反正最好是用原名搜索,这个搜索到的概率最大,如果没有的话就基本能说搜索的条目不存在
#6-2 - 2021-12-20 00:38
屠龙侠912
GonSenMaD 说: 你说的意思好像不清楚,反正最好是用原名搜索,这个搜索到的概率最大,如果没有的话就基本能说搜索的条目不存在
用原名搜索肯定是最准确的啦。但是搜索这件事嘛,肯定是希望越方便越好,说不定有时候就不巧只记得标题里的关键词了。
#6-3 - 2021-12-20 00:51
GonSenMaD
屠龙侠912 说: 用原名搜索肯定是最准确的啦。但是搜索这件事嘛,肯定是希望越方便越好,说不定有时候就不巧只记得标题里的关键词了。
确实你说的情况我遇到过几次,其实我现在搜索习惯用关键字,最好用前面从头开始的,这样搜如果有结果能更快看到,显示会更一目了然,如果用偏后的关键词搜到的结果多的话会乱七八糟,有些因为没有中文或别名而有些甚至自己都不知道就难搜了(说着说着就跑题了啊哈哈哈……)
#6-4 - 2021-12-20 12:58
GonSenMaD
如果这个《标签关联合并引擎系统》做出来了肯定要有AI学习功能了,通过ai只要一个条目出现两个相同意思的标签系统就自动关联合并于是只显示默认的标签,但可以设置成显示自己的标记的
#7 - 2021-12-20 01:11
繁简合并很有必要,其他比如标签这种个人化的东西主要看个人习惯吧,像我喜欢用缩略词比如轻改,如果统一成轻小说改这种四个字标签反而觉得繁琐......
#7-1 - 2021-12-20 01:55
屠龙侠912
赞成,我自己用的是“文学改编”这个四个字哈哈。
#7-2 - 2021-12-20 11:44
GonSenMaD
你还没明白我的意思,我是说标签简繁关联合并,就像我列举的一样,并不是统一,就比如一个条目有中文名和别名一样可以用其中一个搜索到
#7-3 - 2021-12-20 11:55
白峰理沙
GonSenMaD 说: 你还没明白我的意思,我是说标签简繁关联合并,就像我列举的一样,并不是统一,就比如一个条目有中文名和别名一样可以用其中一个搜索到
只是搜索用?真的有人找条目靠标签吗......另外真正小众的条目连标记都没有,统一了标签也不一定找得到
#8 - 2021-12-20 02:48
想法挺好,就差有人做了。顺便把多标签搜索也做了
#9 - 2021-12-20 11:49
(『一言以蔽之,就是「爱」!』)
你站的标签本来就是给自己检索用的。
#9-1 - 2021-12-20 11:59
GonSenMaD
不知道你有没有遇到过这样的问题:不小心手c标错了却不知道?标签过久忘了,渐渐的发现别人的标签更好用更言简意赅,简繁体字到底要用哪种?(这个问题我现在还是非常纠结)如果你遇到过这样的问题应该就懂我的意思了吧
#9-2 - 2021-12-20 12:10
夢回环℃
GonSenMaD 说: 不知道你有没有遇到过这样的问题:不小心手c标错了却不知道?标签过久忘了,渐渐的发现别人的标签更好用更言简意赅,简繁体字到底要用哪种?(这个问题我现在还是非常纠结)如果你遇到过这样的问题应该就懂我的意思...
所以说才是给自己用啊,你标错了可以发现,别人不一定会发现,他一直用他自己的用到底,错的方式千奇百怪(而且怎么定义“错”呢?),你怎么把所有标错的都合并到一起?举个更极端的例子,张三是个纯纯的逆天,他打标签一定要第一个字简体,第二个字繁体,第三个字日语汉字......这咋合并?所以我意思就是直接不用寻思标签共用的问题,自己打自己的就完事儿了。
#10 - 2021-12-20 12:10
(『一言以蔽之,就是「爱」!』)
内容已被用户删除
#11 - 2021-12-20 13:32
看了眼豆瓣的标签和bgm是同样的逻辑,也会有很多语义重复的不同标签。从实现角度看楼主这个想法是不可能的,做得到也是投入产出不成比例。比较可行的是标记选择标签时根据用户当前使用的标签做候选避免typo,配合批量编辑标签脚本能覆盖提到的前两个场景。
#12 - 2022-1-8 11:20
(愛読者諸嬢は御賛成下さいまし)
现在你班的标签系统本质上是个辅助个人记忆用的私人用关键词系统,而不是真正的服务于公认的作品分类的标签系统。所以你班的标签系统以我的意见应该是直接另起炉灶另做一套新的,具体的功能可以直接抄vndb(vndb的标签系统是我见过的功能最完善的了),原来的数据仍然保留私用就好(新系统的初始数据可以由原有的标签系统转换,后边再由维基人慢慢维护。)
#12-1 - 2022-1-9 03:04
小神
同意,个人的东西被平台强行合并了的话,就算确实是同义词也不一定开心的起来。原则上,是否同义的判断交给打了标签的本人才合理。
#13 - 2022-1-8 14:18
(家に帰るまでが遠足です)
就连简繁转换都会遇到“这是日文还是繁中”的困惑。