摘要:数据科学的功能是在数据中寻找有用的观点并加以应用。然而,数据科学并非凭空而来。在向分析目标迈进的过程中,数据从业者可能面临阻碍其进展的各种挑战。
相信不管什么职业的小伙伴们,都离不开数据的加持,数据科学的功能是在数据中寻找有用的观点并加以应用,但是数据不会凭空而来,都是数据从业者收集而来的,但是在收集的过程中,往往数据收集者会遇到不断的挑战,让小编带你们来看看最大的五个挑战是什么。
数据科学的功能是在数据中寻找有用的观点并加以应用。然而,数据科学并非凭空而来。在向分析目标迈进的过程中,数据从业者可能面临阻碍其进展的各种挑战。
Kaggle的调查数据显示,数据科学家面临的最常见挑战包括脏数据(36%),缺乏数据科学人才(30%)和缺乏管理支持(27%)。
在调查中10153名受访者被问到,“在过去的一年中,你工作中遇到了哪些障碍或挑战?(可多选)。”结果如上图所示,排名前十的挑战是:
1. 脏数据(36%的受访者提及此项)
2. 缺乏数据科学人才(30%)
3. 公司政策(27%)
4. 缺乏明确的研究问题(22%)
5. 数据无法访问(22%)
6. 结果未被决策者使用(18%)
7. 向其他人解释数据科学(16%)
8. 隐私问题(14%)
9. 缺乏专业领域知识(14%)
10. 小公司请不起数据科学团队(13%)
结果显示,平均每个数据从业者就会遇到上图中的三项挑战(3是中位值)。不同职位所遇到的挑战数量不同。自认为是数据科学家(Data Scientist)或预测建模师(Predictive Modeler)的数据从业者称遇到了其中的四项挑战。自认为是程序员的数据从业者称只遇到了其中的某一项挑战。
挑战分组
我想将这20项挑战进行分组,把通常一起出现的挑战归为一组,因此我对数据进行了主成分分析(0表示未经历此项挑战;1表示经历过此项挑战)。我发现了一个相当清晰的、由5个主要成分构成的分组方案,其中特定挑战往往会与其他相关挑战一起出现。
· 分析结果未被用于决策:这组挑战还包括公司政策、无法将研究结果纳入决策过程以及缺乏管理支持。
· 数据隐私、真实性、无法访问:这组挑战围绕数据本身展开,包括数据清洗的复杂程度、可访问性以及隐私问题。
· 扩展/部署工具的局限性:这组挑战与用于提取结果、部署模型以及将解决方案扩展到完整数据库的工具相关。
· 缺乏资金:资金缺乏引起的挑战会影响组织机构在外部数据源、数据科学人才以及可能的领域专业知识方面的购买力。
· 提出的错误问题:这组挑战包括难以对数据科学项目的结果保持合理的期望,并且对数据分析没有明确目的或方向。
根据资料表明,一个数据从业者在一年中会遇到上述挑战的三项,在遇到问题时沉着思考,才能真正成为一名优秀的数据从业者。
科技引领新发展,学计算机就来职坐标课堂。
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号