十年数据分析经验分享

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在过去的十年里,作者在多个公司担任分析角色,从德国的小型金融科技初创公司到高增长的预IPO企业(如Rippling)和大型科技公司(如Uber和Meta)。每家公司都有其独特的数据文化,每个职位都有其挑战和经验。以下是作者过去十年里积累的十大关键经验,这些经验在不同公司阶段、产品或商业模式下都适用:

  1. 用数据讲故事
    想想你的受众是谁。如果在研究型组织工作,或主要向技术利益相关者(如工程团队)展示,学术风格的分析可能是合适的。但如果受众是非技术业务团队或高管,则需重点关注关键见解,而不是技术细节,并将工作与所影响的业务决策联系起来。沟通不是分享自己觉得有趣的内容,而是分享受众需要听到的内容。最知名的这种洞察导向、由上而下的沟通方法是由麦肯锡顾问Barbara Minto开发的金字塔原理。
  2. 商业敏锐度是优秀与卓越数据科学家的最大区别
    在一家要求很高的公司,如果你是高级数据科学家,可以预期所有同事都具备很强的技术能力。你不会通过逐步改进技术技能脱颖而出,而是通过确保你的工作为利益相关者(如产品、工程、业务团队)带来最大影响力。商业敏锐度在此发挥作用:为了最大化影响力,你需要深入了解业务的优先事项和利益相关者面临的问题,制定直接帮助这些优先事项的分析解决方案,并以受众理解的方式传达见解和建议。
  3. 做一个客观的真理追寻者
    许多人会选择性地挑选数据以适应他们的叙述。这是有道理的:大多数组织奖励人们实现目标,而不是最客观的表现。作为数据科学家,有奢侈的条件推翻这种做法。数据科学团队通常不直接掌握业务指标,因此比销售等团队面临的短期目标压力小。利益相关者有时会迫使你找到支持他们预先创建的叙述的数据。虽然迎合这种做法在短期内可能会赢得一些分数,但从长远来看,坚持真理的态度会使你脱颖而出,并成为高管们在需要无过滤和无偏见观点时的首选对象。
  4. 数据与初级研究的结合
    数据人员通常对"轶事证据"不屑一顾,但它是严格定量分析的必要补充。进行实验和分析大数据集可以提供统计上显著的见解,但往往会错过一些信号。深入研究关闭交易的笔记、与客户交谈、阅读支持票据等有时是揭示某些问题或真正理解根本原因的唯一途径。例如,在B2B SaaS业务中,可能会在数据中看到企业交易的获胜率下降,甚至可以缩小到某种类型的客户。但要真正理解发生了什么,必须与销售代表交谈,深入研究他们的交易笔记,甚至与潜在客户交谈。
  5. 如果数据看起来好得令人难以置信,那通常是有问题的
    当人们看到指标急剧上升时,他们往往会兴奋,并将这一变化归因于自己做的某件事。不幸的是,当指标变化看起来异常积极时,往往是因为数据问题或一次性影响。例如,最近时期的数据不完整,指标会在所有数据点进入后平稳下来;或者一次性顺风不会持续(如1月初销售激增,这只是节假日积压的订单清理)。需要保持怀疑态度、好奇心和经验,以避免陷阱并生成可靠的见解。
  6. 愿意改变主意
    如果你从事数据工作,经常改变观点是很自然的。例如,你向高管推荐了一个行动方案,但在获得更多数据后失去了对其的信心;或者你以某种方式解释了指标变化,但进行了额外分析后认为另有原因。然而,大多数分析人员由于害怕看起来不称职或惹恼利益相关者,往往不愿意收回过去的声明。尽管这可以理解,但不应仅仅因为害怕失面子而坚持先前的建议。
  7. 务实
    在分析领域工作时,很容易形成完美主义。尽管科学方法训练了我们理想的分析或实验方法,但商业现实常常带来严重的限制。作为数据人员,需要帮助业务团队完成任务,而不是坚持完美的方法。与其追求完美,不如优先完成任务。
  8. 避免数据科学家因临时请求而精疲力竭
    雇用全能数据科学家来主要构建仪表板或执行临时数据提取和调查是一条通向精疲力竭和团队流失的捷径。许多公司,尤其是高增长初创公司,不愿意专门雇用数据分析师或BI人员进行指标调查和仪表板构建,因为他们希望团队具备灵活性。然而,这种做法往往导致数据科学家花费大量时间在这些任务上,从而难以在大型战略项目上取得进展。
  9. 并非所有情况都需要复杂的仪表板
    公司往往认为从电子表格转向BI解决方案是成熟强大的数据文化的标志。尽管关键决策的仪表板应该放在受管控的BI工具中,但许多情况下,Google Sheets能更快速地提供所需结果。团队总会利用日常使用的软件(如Salesforce)和电子表格的分析功能,因为他们需要快速行动。鼓励这种灵活的、分散的分析方法,而不是强制所有分析都通过BI工具进行,可以节省数据科学团队的资源,并为团队提供成功所需的工具(如基本SQL培训、数据建模和可视化最佳实践)。
  10. 实现全公司范围内的指标标准化是不现实的
    在快速增长的初创公司中,强制执行完美的治理是不可能的。尽管数据科学家对不匹配的指标定义感到困扰,但实际上这并不是世界末日。只要关键报告得到严格处理并遵循标准化定义,公司的数据稍微混乱是可以接受的。团队总会通过在BI工具外进行黑客式分析来解锁自己,从而难以强制执行共享数据模型。

这些经验将帮助数据科学家在分析领域脱颖而出,成为真正的思维伙伴。

相关推荐
翔云API4 分钟前
PHP静默活体识别API接口应用场景与集成方案
人工智能
浊酒南街10 分钟前
吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)4.9-4.10
人工智能·深度学习·神经网络·cnn
Tony聊跨境26 分钟前
独立站SEO类型及优化:来检查这些方面你有没有落下
网络·人工智能·tcp/ip·ip
懒惰才能让科技进步32 分钟前
从零学习大模型(十二)-----基于梯度的重要性剪枝(Gradient-based Pruning)
人工智能·深度学习·学习·算法·chatgpt·transformer·剪枝
Qspace丨轻空间43 分钟前
气膜场馆:推动体育文化旅游创新发展的关键力量—轻空间
大数据·人工智能·安全·生活·娱乐
没有不重的名么44 分钟前
门控循环单元GRU
人工智能·深度学习·gru
love_and_hope1 小时前
Pytorch学习--神经网络--搭建小实战(手撕CIFAR 10 model structure)和 Sequential 的使用
人工智能·pytorch·python·深度学习·学习
2403_875736871 小时前
道品科技智慧农业中的自动气象检测站
网络·人工智能·智慧城市
学术头条1 小时前
AI 的「phone use」竟是这样练成的,清华、智谱团队发布 AutoGLM 技术报告
人工智能·科技·深度学习·语言模型
准橙考典1 小时前
怎么能更好的通过驾考呢?
人工智能·笔记·自动驾驶·汽车·学习方法