长江书屋

第27章(第2页)

天才一秒记住【长江书屋】地址:https://www.cjshuwu.com

要么说呢,当年的上下铺不是白睡的,关沛的每个字都精准戳到了凌杨那奇怪的胜负心上,于是地主家的傻儿子拍案而起:「来,三傻,都有哪些小说,拿来我看!

凌杨不知道的是,就在他做完了表,抱着手机夜读《重生之傲娇总裁爱上我》的时候,谢与非也在霸总文的海洋中遨游。

气动声学的那个项目因为她自己一时脑抽选错了算法,又要多跑三个月的数据。

既成的事实沮丧无用,谢与非赶紧补发一封邮件,跟学生强调了算法的重要性。

她自然不会像齐晴一样怪五星逆行,也不会去买个防水逆符挂在包上,她的对策是:打开了搜寻引擎,开始研究霸总文。

做一项研究受到挫折的时候,就用另一项研究来抚慰心灵好了。

作为一名合格的科研工作者,谢与非首先开始做文献收集工作。

Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。

不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。

然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。

接着呢,就是科研狗们最喜欢的收集数据阶段。

谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。

于是她——开始看小说了?

不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。

但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。

开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。

通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。

根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。

根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。

分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。

表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。

于是画起了横轴和纵轴。

除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。

什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。

画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。

同理可证那些打脸文丶丶文都可以一样产出。

小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)

:||

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)


新书推荐

异世界:狼人领主,我靠魅魔发家枭门邪妻懒妻教育得当,三胞胎有事就喊爹韶光艳总裁大人超给力漫兽竞技场传奇篮神乱世情歌:农门女将极品捉妖系统美好生活从六零年代开始明婚暗恋当反派绑定了女主系统侯门嫡女,相公宠上瘾万界基因三国之天下无双大话之神(系统)当幸运值为max时我和大圣是兄弟古代小户之家奋斗史师妹疯癫一笑,对方生死难料大国工程西游记:四川话版凌天至尊我的未婚妻是主播万界时空穿越者