你说我回避这个问题?我整个#2-7都是回答,尤其在第4段:人与机器协作效率能比人工更高(难道说你的“人工”是操作机器的“人工”?)
一本大多数页数样式都不一样的图书(“页数样式”是什么,页数不一样会发生什么),是全世界都有的吧?国外怎么解决呢?我提到《平面设计中的网格系统(Grid systems in graphic design)》是假设你是业内大概看过或至少听说过的一本书,瑞士的约瑟夫·米勒–布罗克曼所著。
批量排版这个概念其实要包含在#2-5自适应排版概念——电子书调整行疏密这一步骤相当于人不断命令机器按新需求批量排版,只是“打印”在屏幕上。
说到排版,我又想到一个问题。维基系统基本是有自己格式的,而书刊每一本都有自己的样式,不同的书刊样式不同,如果采用维基系统,怎么保证适应不同书刊的样式?一本书建一个维基系统?这是不是工程太浩大了些。
也就是说打印为实体书这个步骤只是导出电子书无穷自动排版所得子集中的一个子集,一个字一个字与原稿进行对比已经相当于浪费时间{*},实际上凡是能折算成纯“体力”的苦差事必然会被电脑代替。
格式,参见CSS——没错这是网页技术“层叠样式表”,将表现样式和实质内容相分离。维基就有多种样式,正常网页版、手机版,基于同样内容但表现为不同样式。
如上所说——凡是能折算成纯“体力”的苦差事必然会被电脑代替。只要事先指定好某个内容(参考:维基数据)相当于某书的某格式的样式(其实就类似用HTML的<q><span><br><div>这类标签括起,或相当于维基的模板),某个内容应当出现于某书(相当于维基的模块,会调用维基数据),然后确立每本书的所有样式(相当于写CSS)。剩下工作就是让电脑把样式套到这书的每一页上。如果有新设计,改一下样式。
如果有什么工作是你干起来非常枯燥的,而只要解释一下就可以从路边雇个人帮你干的文本工作,那么就应当交给机器。
*注:(据S1说)我国有政府机构给一个Excel表格排序,是打印出来、每行剪成一条、手工排序、再录入表格,你是觉得这些公务员很勤快,还是在消磨时间。
说到CSS,如果是一本图文混排且由于整体美术设计需要每一页都会要有不同图文排列方式的书籍你能确保程序员写这类复杂样式CSS代码的时间能够短于排版员直接用排版软件排版的时间吗?
真有这么方便的出书系统我真希望有大神赶紧开发出来,救我们这些做出版的人于水火之中。一直说出版业的数字转型,到现在编辑书本很多用的还是最传统的方式,作者来稿之后还是要打印成纸质稿才能开始修改,所以既然有这么好的技术手段怎么就没有人申请个出版局的资助呢,我觉得肯定会批的。
这2个是开始之后不应存在的问题,这问题如果出现其实是说明人没正确选择工具、学会使用工具。现在如果不是故意后期在网页中写错编码,浏览器都不能渲染为乱码。如果一开始出版者们没有确定系统和编码各自为政,那还怎么开始?
是否有什么误解?
“现在的校对除了查看原稿与校样之间是否有差别”——应该让机器完成而非人来做——“外还兼顾检查错别字、病句、语序等”——这才是人干的事——实际上错别字这点机器也可以辅助提示,毕竟人会疏漏而机器不会,Word的红波浪线有目共睹。
是否有什么误解?
我说批量排版并对个别页例外处理(用网页比方就是页内CSS),绝对短于一页页排版的时间,这个逻辑上有问题吗?
再者不由程序员写CSS,写CSS的网站美工不(需要)懂程序。话说回来CSS是个方便理解的比喻,排版显然不是用网页设计软件吧。不过现在W3C确实追求让网页排版技术标准达到出版物的水平,在东亚排版方面咨询了日本出版业者,HTML5<ruby>标签即源自ルビー。
有些HTML5的中文排版规则是日本业内参与建立的。中国的出版业者都在哪里呢?
你不能等待某个人把东西做出来,而是要动脑想哪些工作是可以让机器完成的,然后让程序员实现。排版技术需要程序员与排版业内的合作。有哪些看起来很初级的技术其实原理很高端很厉害? - Belleve 的回答 - 知乎
归根结底,如果抱有“因为(人写的)程序会出错、系统不兼容、我不会用机器达到某某功能、程序还达不到某某功能…所以手工搞最好了”这一信念,而不是“我清楚机器的优势在比人高效万亿倍解决机械的事件,要充分利用工具帮我解决枯燥的问题,只做必须人才能做的事,不浪费时间和生命当人肉计算器…”,那肯定是无法理解了。
首先我要找得到这样一个程序员(或者说技术公司),其次我要保证他们有这样的技术能力,其三我要有足够的资金能够保证他(或他们)能够有意愿去做这个系统出来。然而,这三样我显然都没有,我除了等待某个人把东西做出来还能怎么办?
关于校对:
你认为应该让机器完成的部分很可笑的是现在没有任何出版单位是这么干的,其原因我不太明白,不知道你是否了解。你认为机器辅助的其实现在就在用,方正的黑马校对还是能够帮上点忙的——当然,和Word的红波浪线一样,笑话也很多。
关于排版:
你还是回避了我的问题,我的问题是如果是一本大多数页数样式都不一样的图书(这种情况并不少见),机器是否效率能比人工更高。而且,你之前的回复里也没有提到批量排版这个概念,我当然是按照所有类型图书的排版来理解的。我自然明白在批量排版上软件的优势,事实上有些期刊的编排就在使用系统因为学术期刊的版式相对固定,在这方面有优势。然而,这在图书上行不通。
关于“归根结底”:
我是否可以认为你这段话是针对你在主帖里贴的那条新闻中那位《辞源》编写者把词条一条条复印剪下来的行为?在这一点上我也认为其做法有些奇特,据我所知有辞书出版社就是使用计算机系统对词条进行筛选。至于对错,完全可以等全部筛选完之后在合并并打印再阅读,没必要先打印后筛选还要手抄什么的。
等等,找和尚行不?
(出处)
首先应该强调Word的红波浪线比人苛刻不会疏漏(除非程序员疏漏),而不是强调笑话多。程序的笑话是人的疏漏,可以弥补,但哪个人也不能保证能和机器一样不会疏漏。
一本大多数页数样式都不一样的图书(“页数样式”是什么,页数不一样会发生什么),是全世界都有的吧?国外怎么解决呢?我提到《平面设计中的网格系统(Grid systems in graphic design)》是假设你是业内大概看过或至少听说过的一本书,瑞士的约瑟夫·米勒–布罗克曼所著。
批量排版这个概念其实要包含在#2-5自适应排版概念——电子书调整行疏密这一步骤相当于人不断命令机器按新需求批量排版,只是“打印”在屏幕上。
话说你的问题“机器是否效率能比人工更高”是很奇怪的,人创造机器就是为了达到人所不能的效率、自枯燥工作中解放人、投身到更属于人的创作,于是这个问题自己回答了自己:“终将更高。就算现在做不到将来也会更高”。你的真正想法是否想表达“我想找到一个机器目前暂时做不了需要人工的事情来证明机器永永远远做不了人工,最好还能顺带证明人工智能也不行”。于是,你绝望地写道“然而,这在图书上行不通”。
如果所有人都这么想,而不去想“也许行得通呢”,那确实行不通啊。
然后关于制作排版系统的问题,我觉得还是你理解错了。我的意思是以我的人脉关系找不到程序员(或者技术公司)来做这件事,就算是找到了我也没有足够的专业知识来判断这个程序员(或者技术公司)是否能够制作这样一个系统,何况以我实际的财力也没有足够的资金能够保证他(或他们)能够有意愿去做这个系统出来。我#2-8的第一段所有假设的出发点都是现在的我,中国业内有没有这样的程序员(或者技术公司)或者有没有能够完成这件事情的人不在我的讨论范围之内。从现在的我出发,我觉得自己没有能力(召集一批人)来搞这样的排版系统,所以我的结论是只能等别人来做。你把我的出发点一下子扩大到了国家层面,是不是想太多了?不要总想搞个大新闻。
至于你举的和尚的例子,烦请你解释一下这个例子和排版有什么关系?典籍整理涉及排版?就算是好了,典籍全是文字,其排版难度大概还比不上学术期刊,而我在#2-8已经说了,在学术期刊的排版上,批量排版有优势,所以我都同意了的观点你为什么还要举个例子来绕圈子?完全不明白你的用意。
恕我直言,“国内单位没有我相信,上面的手动Excel表格排序并不是笑话。那国外同行呢。也许我国观念不落后,甚至比国外先进吧”这段话是想表达什么我完全不明白。我在#2-8最后一段已经说了,我也不理解《辞源》编写者的做法,我觉得这可以间接说明我也觉得手动Excel表格这件事并不能说明公务员勤快,在这件事上我的看法应该和你是比较接近的。
还有关于计算机校对错误所产生的笑话,这是实际存在的事情,我只是陈述事实。我也说了,这些计算机校对软件“还是能够帮上点忙的”,我说笑话很多只是想表明事物存在两面性,想表达计算机和人协同工作才是最好的,而并不是你所理解的想要“强调笑话多”。所以,请你不要在此基础上进一步延伸出诸如我有““因为(人写的)程序会出错、系统不兼容、我不会用机器达到某某功能、程序还达不到某某功能…所以手工搞最好了”这种想法。
此外,我是做文字工作的,虽然从工作内容上来说需要有一些书刊设计的基本概念,但毕竟不是做美术设计或者专业排版的,所以你说提到的《平面设计中的网格系统(Grid systems in graphic design)》一书我没有听说过。我觉得你说的业内应该和我的业内不一样。
希望这一次你能认真的阅读我的回答,就像我每次为了回复你而反复阅读你的回答一样。虽然我很怀疑你已经将我脑补成一个拥有“机器不行,人工智能也不行”这种想法的人,同时还认为我“不去考虑机器的可能性,而只想抱着传统方法”。因为从#2-7和#2-9最后一段你那上纲上线地“控诉”,我只能做这种理解。
然后你的问题修正为“在这种情况下”+“在现有技术条件下”,编写代码自动排版是不是相较排版员使用排版软件能够更有效率?
不好意思,这个问题有两个截然相反的答案,取决于“编写代码自动排版”究竟是怎样的操作——是我在#2-7提及的程序辅助排版(1)?还是写一个排除一切人工操作的程序,只需倒入即可排版(2)?
答:(1)更有效率;(2)反之。
我操现在软件可以自动校对了,好棒!! - 书记今天的帖。
工作被效率更高的机器抢了是什么体验? - 冀钦的回答 - 知乎
这人是编辑,居然说法与我有部分巧合,惊了:
不能因为输入员输入不了(实际上文中说了“水平不高”)就放弃输入了,不是更应该积极想办法解决吗。
文中说的“通用的八位国际编码”好像就是Unicode的UTF-8。
2000时期的Unicode确实缺字(中日韩统一表意文字扩展B区是Unicode3.1 (2001年3月)才有),不过当时Unicode3.0 (1999年9月)就包含了表意文字描述字符,可以用来描述不存在的汉字,比如113号以后元素的中文字。
要是当年我在组中而且只知道Unicode3.0,软件只有WPS,首先是花半个月给Unicode现存汉字全部列出拆字表。遇到生僻字到表中搜索确认没有,自己创建一个“辞源code”加新字描述。最终获得一份“辞源code”表联系Unicode组织——不过我一查现实中Unicode组织也确实在Unicode3.1接收了辞源66字,后来又陆续接收了4字。说明确实积极想办法了。
https://en.wikipedia.org/wiki/CJK_Unified_Ideographs
辞源的代号是GCY(中国(G)辞源(CY))
因为《辞源》是一本有关古代汉语的辞书,校正形源、音源、义源、典源、证源,增添书证的过程中会引用大量生僻字、异形字,逐字输入相当困难,也耗费时间。所以,编纂组才会在第二步(复查书证)采用纸上办公,之后再请专业输入员录入电脑。
我大学时选修过训诂学,大概了解异形字、生僻字的处理有多困难。就目前资料看,具有汉字字形的表意文字大概在10万个以上,utf-8大概没有收录这么多汉字,并且也不必要(有些字使用次数太少了)。古籍出版领域,一般都是把这些字直接做成图片…
当然,以上都是基于古文字、古代汉语的特殊性,我觉得某些工序采用手写办公可能比电脑办公更快捷。大众出版领域,应该还是信息化程度比较高吧。
不过,说实话,我不太喜欢用电子屏。我比较熟读的纸质书,随手一掐就能找到想找的内容,电子屏就不行。有人说这是运用了人的空间记忆能力,我觉得《辞源》组用卡片法大概也和这个有关,我日常读书也会抄卡片
这一页我所遗憾的是让专家大量时间浪费在机械工作上。先前举例“把表格打印出来剪成一条条手动排序居然是真的”也是类似意思。
最后结论是辞源独有的生僻字并没有那么多…
我只是表达一下,复查书证用纸质化办公比较方便,针对“《辞源》编写者把词条一条条复印剪下来的行为比较奇特”这个问题回复罢了,不是在说录入工作…
话说我没问为什么没有电子字库啊,毕竟答案很明显。