让炼丹更玄学!苏大博士生用“天干地支”生成随机种子,项目已开源( 二 )


通常在两个任务中会用到:
1.将数据分割成训练/验证/测试集:随机种子确保每次运行代码时都以相同的方式分割数据
2.模型训练:随机森林和梯度提升等算法是非确定性的(对于一个给定的输入 , 输出并不总是相同的) , 因此需要一个随机种子参数以获得可重复的结果
除了可重复性之外 , 随机种子对于具有参考性的结果也很重要 。 比如测试一个算法的多个版本 , 重要的是所有版本都使用相同的数据 , 并且尽可能的相似(除了需要测试的参数) 。
有些人每次都使用同一个种子 , 而有些人则随机生成 。
举个例子 , 当使用Scikit-learn训练机器学习模型时 , 从sklearn.model_selection模块中导入的函数train_test_split使用随机状态等参数来获取随机种子的输入 。
random_state=42这个参数在每次运行上述代码时都将随机种子设置为相同的值 , 也就会得到相同的验证集(X_test , y_test) 。
AI写你的每日星盘
当然 , AI作妖这么浪漫的点子 , 不会仅限于中国码农 。 用AI写星盘的点子 , 美国码农也有过 。
2017年 , VICE杂志就有报道过 , 三个兼具码力、产品开发力、和星座学爱好的纽约码农 , 苦于当时市面上的「智能星盘」、「自动星盘」app只会复读录入的苏珊米勒们1990年代的作品 , 自己做了个「星盘算法」 。
基本机制倒不复杂 。 开发者首先录入各种天体运动在星相学上的对应算命阐释 , 同时开发接口自动扒来NASA公开的天体追踪数据 。 然后开发算法将这些数据的计算结果对应起来 , 同时开发自然语言生成器 , 让算法结果以「你的每日星盘」文章出现 。
让炼丹更玄学!苏大博士生用“天干地支”生成随机种子,项目已开源
文章图片
这些星座学爱好者还有非常合格的产品经理能力 , 「星盘算法」app特别强调加好友的社交功能 。 不仅可以对照各人的星盘表 , 还能生成各人之间的星相契合性 。
各种天体与十二黄道星座互动的「入宫」 , 对各人和各人好友的命运影响和互动 , 在app上也有呈现 。 加的好友越多 , 呈现的结果就越具体 。
「星盘算法」的开发者很开心地对VICE说:「我们当然知道这不是科学算命 。 但这是一种有趣的故事阐述方式 , 既基于古神话学、又基于当代人性格 , 很好玩的 。 」
不过不仅浪漫是普世的 , 理科生靠实力单身的性格好像也是普世的 。 2020年就有码农去推特上采样星盘推特回复的表情图频率作为原始数据 , 写了个项目来跑统计 。 以回复者的准确与否表态 , 来验证星座学是否真能有效算命……
让炼丹更玄学!苏大博士生用“天干地支”生成随机种子,项目已开源
文章图片
废话 , 当然不能了 , 真是不解风情 , 做这个项目的人一定不会有女朋友 。
让炼丹更玄学!苏大博士生用“天干地支”生成随机种子,项目已开源
文章图片
参考资料:
https://github.com/Spico197/random-luck