中科院统计学考研复试面试题目汇总
作者:科大科院考研网 发表时间:2021-11-17 来源:研招办
1.说出两种不同的参数估计方法,并详细介绍其中一种估计方法,对某未知参数,如何比较两个不同估计量的优劣。
极大似然估计,最小二乘估计(最小均方误差),矩估计(用样本 k 阶矩代替总体的 k 阶矩)。
矩估计法(也称数字特征法):
直观意义比较明显,但要求总体 k 阶矩存在。
缺点是不唯一,此时尽量使用样本低阶矩。
观测值受异常值影响较大,不够稳健,实际中避免使用样本高阶矩。
估计值可能不落在参数空间
极大似然估计法:
具有一些理论上的优点(不变性、相合性、渐近正态性)
缺点是如果似然函数不可微,没有一般的求解法则。
2. 统计学
是利用数据解释自然规律的科学,内容包括如何收集和分析数据。
是在数据分析的基础上,研究测定、收集、整理、归纳和分析反映数据,以便给出正确消息的科学。
3.人工智能
指由人制造出来的机器所表现出来的智能。
4. 机器学习
机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
机器学习是对能通过经验自动改进的计算机算法的研究。
机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
一种经常引用的英文定义是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
5. 深度学习
深度学习(DL)是一类机器学习算法,使用多个层逐步从原始数据中提取更高层的特征。——wiki
深度学习就是构建由参数化功能模块构成的网络,并利用基于梯度的优化方法进行样本训练。——Yann LeCun
6.区分显著性水平和置信区间
显著性水平:希望在样本结果的不可能程度达到多大时,就拒绝原假设,也就是小概率事件发生的概率。则是假设真值是多少,然后检验这个假设是否可能为真。
置信区间,目的是根据样本构造一个区间,然后希望这个区间可以把真值包含进去,但是并不知道这个真值是多少