第117章 进组(1 / 2)

第117章 进组(第一更)<b />

“你的这组数据里,重复值是怎么处理的?”<b />

程风推了推眼镜,偷偷抬头看了看方豫,讷讷的问道。<b />

这是体育生吧?这是体育生吧?这是体育生吧?<b />

体育生都开始建模了吗?<b />

方豫一进门,接近一米九的身高和壮硕的身材就带给程风很大的视觉压力。<b />

等方豫坐下后,程风更是感觉到方豫身上有种若有若无的威圧感,让他有一种在面对导师时的感觉。<b />

方豫只当程风是个书呆子学长,没太在意他的异常。<b />

方豫不知道的是,生命本质的连续提升,让普通人面对方豫时,会产生一些低位生物面对高位生物的畏惧。<b />

现在方豫还只是一个二级法师,等到了更高等级时,这种状况会更加明显。<b />

很多不想放弃人类正常社交生活的奥术法师,就会选择使用类似“温和之力”手环的道具或奥术封印压制住自己的上位者气息。<b />

听到程风的问题,方豫露出思考的表情:“用pandas的dupliated方法返回一个布尔型seies,可以识别重复值,然后用dp函数或keep函数删除就好了。”<b />

“如果是特征重复的,就要用方法计算特征相似度,用ethd参数指定肯德尔或斯皮尔曼相关系数。”<b />

听到方豫的回答,程风不由得一愣,这完全出乎他的意料。<b />

虽然程风问的只是一些基础的内容,但能获得如此清晰的回答,也是完全出乎程风自己的意料。<b />

程风仍旧不太敢看方豫,盯着屏幕:“那离群值你又是怎么识别的?我看到你用winsiin方法调整了离群值,为什么用winsiin而不是用众数替代或删除?”<b />

方豫又思考了一下:“对于数值型数据,用箱线图和直方图进行识别,当然也可以用desibe函数生成的描述信息识别,分类数据,用条形图识别,还有一部分正态分布数据用3σ准则进行识别。”<b />

“至于说处理,因为删除离群值会让样本数显著减少,我又不了解后续算法对离群值是否敏感,用众数替代如果掩盖了数据的变异性可能会对结果产生影响,所以采用winsiin方法调整了离群值。”<b />

程风看了看方豫,半天没说话。<b />

至少在大二的时候,他肯定是没这个水平的。<b />

别说方豫只是金融学专业,就算是数学专业的,大二时也不过刚刚开始接触一些初级的数据结构和基础编程。最多也就是刚刚开始接触数据清洗和数据操纵的相关内容。<b />

很多人直到大四,甚至到了研究生进组,还没搞明白到底如何评估离群值,说不准估着估着,把正常值都当成离群值清洗了。<b />

而方豫刚刚对这两个基础问题的回答,虽然简练,但很明显已经熟练掌握了清洗数据的相关技能。<b />

更重要的是,他不仅能够区分处理重复值和离群值的不同方法,还能够讨论不同统计方法的适用场景,并提供具体的代码实现。<b />

这可就不是一般学生能掌握的了,除非他早就深度参与过一些数据建模的项目。<b />

伱特么玩我呢吧?你这种学金融学的少爷,把应用数学学这么好干吗?有必要吗?<b />

你们不是应该毕业拼资源去吗?干嘛抢我们这些小镇做题家的饭碗?<b />

而且,你一个金融专业的,是怎么把数学学这么好的?平时不上专业课的吗?<b />

经济学和金融数学是数学和物理专业的自留地你不知道吗?<b />

你也不看看,校内的这些教授,哪个本科不是读的数学和物理?<b />

你一个经济学院的,跟着凑什么经济学的热闹啊。<b />

难道这就是真天才和小镇做题家的差别吗?<b />

不,你们最大的差别是方豫有挂。<b />

“学长?”方豫疑惑的叫了声程风。<b />

刚刚的回答中,技术层面的答案大多数都是柚子通过埃瑟朗之核传递过来的,不过方豫还是往里面补充了一些观点性的东西。<b />

“方豫学弟,我没有……”程风刚说了一半,就听到实验室门口传来一个声音。<b />

“假如后续采用线性回归模型,你准备如何处理这组数据中的离群值和特征相似度?”方豫一回头,就看到童永山正从门口走进来。<b />

而在童永山身后,还有一名身穿旗袍的二十六七岁年轻女子。<b />

女人不算太漂亮,方豫打分的话,长相最多也就能给她打70分。<b />

身材倒是还不错,能有80分。<b />

但这风情,可是90分的水平。<b />

“老师!师姐。”<b />

“院长好。”<b />

程风赶紧从椅子上站起来,向导师问好。<b />

最新小说: 重生渔村:从截胡村花阿香开始 夏小星秦骏 人类销毁计划(NP) 桃源仙医:姑娘,该吃药了! 特摄:从迪迦奥特曼开始 战神空间 潜伏体 武破乾坤 永历大明 精灵:钓鱼佬的雨天队