Перед вами первая книга, в которой рассматриваются базовые навыки программирования и статистики, охватывающие весь жизненный цикл. Она адресована всем желающим работать в области Data Science или любой другой смежной области, а также аналитикам данных, преодолевающим разрыв между техническими и нетехническими областями. Если вы обладаете базовыми знаниями программирования на Python, вы научитесь работать с данными при помощи стандартных инструментов вроде pandas.
Прочитав книгу, вы сможете:
- сформулировать задачу так, чтобы ее можно было решить с помощью данных;
- выполнить сбор данных, включая обработку текста, веб-скрапинг и т.д.;
- извлекать полезную информацию путем очистки, исследования и визуализации данных;
- использовать моделирование при описании данных;
- обобщать результаты, выходящие за рамки данных.