Ciències de dades
Què és la ciència de dades?La ciència de dades proporciona informació significativa basada en grans quantitats de dades complexes o dades grans. La ciència de dades, o ciència basada en dades, combina diferents camps de treball en estadístiques i computació per interpretar dades amb finalitats de decisió.
Comprensió de la ciència de dades
Les dades s’obtenen de diferents sectors, canals i plataformes, com ara telèfons mòbils, xarxes socials, llocs de comerç electrònic, enquestes sanitàries i cerques a Internet. L’augment de la quantitat de dades disponibles va obrir la porta a un nou camp d’estudi basat en grans dades: els massius conjunts de dades que contribueixen a la creació de millors eines operatives a tots els sectors.
L’accés continuat a les dades és possible a causa dels avenços en tecnologia i tècniques de recollida. Es pot controlar els patrons i el comportament dels individus i es poden fer prediccions a partir de la informació recollida.
Tanmateix, les dades cada vegada més grans no estan estructurades i requereixen un analisi per a una presa de decisions efectiva. Aquest procés és complex i requereix temps per a les empreses, per tant, l’aparició de la ciència de dades.
La ciència de dades, o la ciència basada en dades, utilitza grans dades i aprenentatge automàtic per interpretar dades amb finalitats de presa de decisions.
Breu història de la ciència de dades
El terme ciència de dades existeix durant la millor part dels darrers 30 anys i es va utilitzar originalment com a substitut de la "ciència informàtica" el 1960. Aproximadament 15 anys després, es va utilitzar el terme per definir l'enquesta dels mètodes de processament de dades utilitzats en diferents. aplicacions. El 2001 es va introduir la ciència de dades com a disciplina independent. La Harvard Business Review va publicar un article el 2012 on es descrivia el paper del científic en dades com la "feina més sexy del segle XXI".
Compres per emportar
- Els avenços en tecnologia, Internet, mitjans de comunicació social i ús de la tecnologia han augmentat l’accés a les dades grans.
- La ciència de dades utilitza tècniques com l’aprenentatge automàtic i la intel·ligència artificial per extreure informació significativa i predir patrons i comportaments futurs.
- El camp de la ciència de dades està creixent a mesura que avança la tecnologia i les tècniques d’anàlisi i recopilació de dades grans es sofistiquen.
Com s'aplica la ciència de dades
La ciència de dades incorpora eines de diverses disciplines per reunir un conjunt de dades, processar i obtenir informació del conjunt de dades, extreure dades significatives del conjunt i interpretar-les amb finalitats de decisió. Les àrees disciplinàries que formen el camp de la ciència de dades inclouen la mineria, estadístiques, aprenentatge automàtic, analítica i programació.
La mineria de dades aplica algoritmes al complex conjunt de dades per revelar patrons que després s’utilitzen per extreure dades rellevants i útils del conjunt. Les mesures estadístiques o els analítics predictius utilitzen aquestes dades extretes per avaluar esdeveniments que és probable que ocorrin en el futur en funció del que les dades mostren passat en el passat.
L’aprenentatge automàtic és una eina d’intel·ligència artificial que processa quantitats massives de dades que un ésser humà no seria capaç de processar durant una vida. L’aprenentatge automàtic perfecciona el model de decisió presentat sota analítiques predictius, coincidint amb la probabilitat que un esdeveniment passi a allò que realment va passar en un moment previst.
Usant analítiques, l'analista de dades recopila i processa les dades estructurades des de l'etapa d'aprenentatge de màquines mitjançant algoritmes. L’analista interpreta, converteix i resumeix les dades en un llenguatge cohesionat que l’equip de presa de decisions pot comprendre. La ciència de dades s’aplica a pràcticament tots els contextos i, a mesura que evolucioni el paper del científic de dades, el camp s’ampliarà fins a l’arquitectura de dades, l’enginyeria de dades i l’administració de dades.
Fet ràpid
Segons IBM, s'espera que la demanda de científics de dades augmenti un 28% el 2020.
El Data Scientist va definir
Un científic de dades recopila, analitza i interpreta grans volums de dades, en molts casos, per millorar les operacions d’una empresa. Els professionals de científics de dades desenvolupen models estadístics que analitzen dades i detecten patrons, tendències i relacions en conjunts de dades. Aquesta informació es pot utilitzar per predir el comportament del consumidor o per identificar riscos operatius i empresarials. El científic de dades és sovint un historiador que presenta informació sobre els responsables de les decisions de manera comprensible i aplicable a la resolució de problemes.
Ciències de dades d'avui
Les empreses estan aplicant grans dades i ciències de dades a les activitats quotidianes per aportar valor als consumidors. Les institucions bancàries estan capitalitzant grans dades per millorar els seus èxits de detecció de fraus. Les empreses de gestió d’actius utilitzen dades grans per predir la probabilitat que el preu d’una seguretat s’alça o baixa en un moment determinat.
Empreses com Netflix exploren grans dades per determinar quins productes han de lliurar als seus usuaris. Netflix també utilitza algoritmes per crear recomanacions personalitzades per als usuaris en funció del seu historial de visualització. La ciència de dades està evolucionant a un ritme ràpid i les seves aplicacions continuaran canviant de vida en el futur.
Comparació de comptes d'inversió Nom del proveïdor Descripció del anunciant × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació.