Data science - od czego zacząć

05 Jan 2014 / admin

Początki są trudne. Od czego zacząć? Internet jest pełny materiałów o big-data, data science, ale nadmiar materiałów nie ułatwia wyboru.
Pewnie już chciałbyś usiąć do komputera i napisać jakiś program. Przyjdzie na to czas, kiedy dowiesz się jaki język wybrać i poznasz przykładowe zagadnienia z zakresu data science.

Według jednej z definiji data scientist to ktoś kto jest lepszym statystykiem (ekonometrykiem?) niż jakikolwiek "zwykły" programista i lepszym programistą niż jakokolwiek "zwykły" statystyki. Pomińmy błąd logiczny w tej definicji (Wikipedia dla ciekawych jaki to błąd), skoncentrujmy się na tym że data-science stoi na dwu nogach:

  • programowanie (a także bazy danych)
  • statystyka (a także matematyka, ekonometria)
Zacznij od uzupełnienia wiedzy z tych zakresów. Prawo malejącej produktywności krańcowej podpowiada, żeby zacząć od tego z czego masz większe braki (w tym zakresie osiągniesz szybszy przyrost wiedzy).


Przeczytaj jakąś "nietechniczną" książkę, która da Ci obraz dziedziny data-science. Na przykład Podstawy nauki o danych. Bądźmy szczerzy: to przedszkole data-science nie nauczysz się z takich książek konkretnych umiejętności. Ale warto -- zobaczysz przykłady, podstawowe narzędzia i na tej podstawie wybierzesz kursy online (bądź stacjonarne szkolenia) i lektury zaawansowanych książek.




1