The Data Science Handbook contains candid interviews with 25 of the world’s best data scientists. We sat down with them, had in-depth conversations about their careers, personal stories, perspectives on data science and life advice. In The Data Science Handbook, you will find war stories from DJ Patil, US Chief Data Officer and one of the founders of the field. You’ll learn industry veterans such as Kevin Novak and Riley Newman, who head the data science teams at Uber and Airbnb respectively. You’ll also read about rising data scientists such as Clare Corthell, who crafted her own open source data science masters program. This book is perfect for aspiring or current data scientists to learn from the best. It’s a reference book packed full of strategies, suggestions and recipes to launch and grow your own data science career. Table of Contents This book contains insight and interviews with data scientists from established companies such as Facebook, LinkedIn, Pandora, Intuit, and The New York Times. We also spoke with data scientists at fast-growing startups such as Uber, Airbnb, Mattermark, Quora, Square and Khan Academy.
برای کسی مثل من که علاقه مند است تا بداند در ذهن بزرگان حوزه داغ و رو به رشد تحلیل داده و بیگ دیتا و بیزینس های مرتبط چه میگذرد، شاید بهترین انتخاب بود. مصاحبه با جمعی از موفق ترین افراد این حوزه توسط مصاحبه کنندگانی که خودشان از متخصصین و آشنا به مفاهیم بودند. مصاحبه های ابتدایی از مصاحبه های میانه های کتاب جذاب تر به نظر می رسیدند، شاید چون از جایی به بعد برخی مطالب تکراری میشدند یا نکات جذاب رفته رفته به شکلهای مختلف خود را نشان میدادند. یکی از مهمترین نکاتی که بسیار بر روی آن دست گذاشته میشد، به نوعی تعریف یک متخصص این رشته است، فردی که توانایی برنامه نویسی حرفه ای را دارد، کار آماری را می تواند بخوبی انجام دهد، اما در کنار اینها و شاید مهمتر، توانایی داستان گویی و منتقل کردن نتایج تحقیق است. کاری که شاید چندان در دنیای آکادمیک به آن پرداخته نمی شود. البته فصلهایی هم هستند مانند "جاش ویلیس" که با آدمی سرشار از تبختر روبرو می شویم، اما خوب است که حرفهای چنین افرادی را هم شنید، افرادی که در حوزه تخصصی خود موفق محسوب می شوند اما ممکن است به لحاظ شخصیتی چندان دلچسب ما نباشند. یا در مواقعی عادتهایی ترویج می شوند که شاید خوشایند نباشند، عادت به کم خوابی و اعتیاد به کار، که برای منی که در محیط پیرامونی ام چنین افرادی با انواع و اقسام مشکلات خانوادگی و ضعف در مهارتهای اجتماعی فراوان اند، شنیدن این حرفها از سوی افرادی که احتمالا الگوی متخصصین تازه کار هستند، خوشایند نباشد
اما فارغ از این نکته های مثبت و منفی موجود در متن، یک ضعف بزرگ به ذهنم می رسد که شاید البته بتواند فراتر از موضوع این کتاب بدان پرداخته شود. این همه انسان و سرمایه ذهنی که در کتاب به آنها پرداخته شد، با انواع و اقسام نوآوری در ایجاد محصول های بهتر، زمان بندی دقیق تر برای ارسال ایمیل تبلیغاتی، الگوریتم های مناسب تر برای جلوگیری از حیله های تجاری و غیره که در جای خود بسیار مهم اند و به فرهنگی مصرفی شکل و نظم بهتری می دهند، چرا کسی دغدغه های بزرگتری ندارد یا تلاشش را در آن راستا صرف نمی کند؟ چرا تلاش برای استفاده از داده برای حل معضلاتی نظیر تغییرات آب و هوایی در مصاحبه ها به چشم نمی خورد؟ چرا کسی دنبال ایجاد زیرساختی برای جمع آوری داده در نقاطی که به علت نبود زیرساخت، فقر و سایر کمبودها داده ای وجود ندارد نیست؟ آیا این صرفا سیستمی نیست برای مصرف بیشتر و بهینه تر در نقاط توسعه یافته دنیا که با ادامه این کار، این شکاف روز به روز بیشتر خواهد شد؟ تنها استثنا را می توان در مصاحبه "شان گورلی" دید که در جنگ عراق کار میکرده و مدل ریاضیاتی جالبی هم داده که تد تاک آن و مقاله نیچر مرتبط با آن را میتوانید در کتاب بیابید. اتفاقا این تنها شخصی هم هست که از خواندن عادت های کار و زندگی اش لذت بردم، کسی که می گوید دو ساعت کار مفید در زمان دکترا هم کافی بوده، و بدن نیاز دارد ورزش و فعالیت مفید تا بتواند به شیوه موثرتری کار و فکر کند. چنین اندیشه هایی حتی در همین کتاب نیز کمیابند
The book is a compilation of interviews with 25 distinguished data scientists and experts in data science, providing not only an interesting glimpse into their paths to data science but also some super useful and candid advice to young practitioners and people planning to enter the field. A common thread among the interviews is that a good data scientist must go beyond understanding the data and building excellent, reliable models, communicating effectively the results and their meanings to others not involved in the analytical process, particularly the decision makers. In fact, as several of them mentioned, the ability to craft an engaging story around the implications of one's analysis is perhaps one of the most difficult and underrated skills for data practitioners. In addition, I especially like the analogy John Foreman (Chief Scientist at MailChimp) gave when he compared outstanding data scientists to Renaissance figures, as they communicate and facilitate changes just as deftly as they wrangle unstructured, messy data. There are much more insights on what data science jobs are really like on the ground and how to grow in this field in the book, and I would encourage anyone who are interested in data science to take a look.
Most interviews were interesting enough. There were between 3 and 5 which were really boring around the middle of the book, but the second half has more interesting scenarios. It doesn't give any advice, just interviews from data scientists into how they got there.
The Data Science Handbook was a surprisingly engaging exploration of a diverse group of successful data scientists. As a field that is still young and broadly defined, the description and value of data science tends to have a lot of conflicting opinions projected on to it by people in various positions. Taking in the experiences of real industry leading experts in the domain helped mature my own understanding of data science as a newcomer and has already inspired my direction moving forward. You get a fuller sense of the breadth of applications that data science can and cannot be applied to, and it's potential to continue changing the way the world operates. I would recommend this book to anyone who is beginning their pursuit of knowledge in this field and it will likely be a book that I revisit further down the road.
Very nice book with viewpoints, advice, career path from different data scientists in US. I've certainly learned several things from the book. The authors did what I also did on a smaller scale, which is to interview several heads of DS around my city to understand their stories. I hope I can pick this up more later.
One sentence that made me laugh is: we can't solve everything by RMSE. I'm not sure if there are other people having the same thought.