При обработке больших данных Питон работает медленно (~ в 100 раз медленнее C++). Почему, тем не менее, он является фактическим стандартом Data Science?
Причины:
- Быстрая разработка — в силу простоты и высокоуровневости, его легко изучать и использовать
- Многие библиотеки (например, numpy) написаны на C++, т.о. снижая проблему производительности
- Развитая экосистема
- В общем цикле работы с данными (поиск и обработка, development, IO-operations, calculations, анализ результатов, пр.) самым дорогим сейчас является coding time, а не calculation time
- Питон — интерпретируемый язык, а не компилируемый. При компиляции приходилось бы каждый раз перезагружать большие объёмы данных (если таковые используются в проекте)