Fundamentos de Ciência de Dados

Informação

Corpo docente: Sérgio Matos

Duração: Semestral

Horas de trabalho: 162

Horas de contacto: 45

ECTS: 6

Área científica: Informática e Matemática

Objetivos

Esta UC oferece uma visão geral de toda a cadeia de processos, dos desafios, e das diferentes áreas de aplicação da Ciência de Dados.

Resultados de Aprendizagem

No final desta UC, os alunos deverão:

  • ser capazes de explicar a cadeia de processos e os desafios que envolvem um projeto de ciência de dados;
  • conhecer e compreender os vários tipos de dados, os processos de recolha, as características dos dados em larga escala, incluindo velocidade, variedade, variabilidade, veracidade;
  • conhecer e aplicar métodos para processamento e limpeza de dados, lidando com dados errados e em falta;
  • conhecer, aplicar e saber interpretar os resultados de métodos de exploração e representação de dados;
  • perceber e saber lidar com as implicações da ciência de dados em termos de ética e privacidade.

Avaliação

A avaliação será baseada em um projeto prático, com entregas parciais, relatório e apresentação.

Metodologia

A UC seguirá uma abordagem predominantemente expositiva de forma a apresentar e relacionar os vários tópicos, apoiada na análise de casos típicos sempre que adequado. Esta exposição será complementada com o desenvolvimento incremental dos projetos, que permitirá aos alunos consolidar os aspetos teóricos e adquirir experiência prática.

Conteúdos

  • Introdução e conceitos fundamentais Ferramentas e frameworks
  • Fontes e tipos de dados
  • Recolha de dados
  • Qualidade, limpeza e pré-processamento de dados Armazenamento e gestão de dados
  • Redução de dimensionalidade
  • Análise exploratória de dados
  • Visualização e apresentação de resultados Operacionalização
  • Ética e privacidade

Bibliografia recomendada

  • Python for Data Analysis, 3rd Edition, Wes McKinney, 2022
  • Python Data Science Handbook: Essential Tools for Working with Data, Jake VanderPlas, 2016
  • Data Science from Scratch, Joel Grus, 2nd Edition, 2019
  • The Data Science Handbook, Field Cady, 2017