About
Brazil
Home > Blogs >

Um dia na vida de um cientista de dados

Data

Você já se perguntou o que um cientista de dados faz o dia todo? Com o que eles se preocupam e onde o trabalho deles leva? Niranjan Pedanekar é um cientista principal da Tata Consultancy Services (TCS) Research. Aqui ele dá uma visão de um dia típico no escritório e revela que não é tudo sobre processamento de dados ...

Eu me levanto por volta das 7h30 e vou direto para o escritório. Estou encarregado de um grupo chamado Área 66. Todos nós somos cientistas de dados e todos temos níveis variados de experiência.

Eu montei este grupo há cerca de dois anos, porque eu estava realmente interessado em entretenimento e como os humanos se envolvem com isso. Eu também sou dramaturgo, ator e diretor, então eu luto com essas mesmas perguntas no meu trabalho também.

O que minha equipe faz se situa em algum lugar entre a pesquisa acadêmica e o trabalho da indústria e fica na intersecção entre entretenimento, ciência de dados e ciência comportamental.

No momento, estamos analisando os aplicativos de inteligência artificial para os setores de entretenimento, mídia e publicidade. Escrevemos algoritmos que nos permitem anotar a mídia de várias maneiras automaticamente.

Vamos fazer filmes, por exemplo. Estamos tentando criar um algoritmo que reconheça as diferentes intensidades emocionais em um filme. Assim, uma sequência de ação é de alta intensidade, mas uma cena em que as pessoas estão sentadas em uma sala de reunião e conversando é de baixa intensidade. Os dados que usamos para isso são coisas como a paleta de cores, a música e a velocidade da ação em uma sequência.

Trazendo AI ao cinema

Você pode estar se perguntando por que fazemos isso. Bem, existem várias aplicações para isso. Uma delas é a colocação de anúncios, o que às vezes pode atrapalhar a ação do filme. Você pode ter uma cena realmente séria, seguida por um anúncio cheio de pessoas dançando, e então você volta ao filme sombrio.

Nossa tecnologia permitiria que os anúncios combinassem com o clima do filme - um anúncio para uma bebida depois de uma cena no deserto ou um anúncio de tênis depois de uma cena em que as pessoas estão correndo.

Além disso, estamos analisando como anotar filmes com base na configuração. Então, seria capaz de distinguir entre uma cena de perseguição em uma floresta e uma cena tranquila na praia. Isso pode ajudar a Netflix, a Amazon e outros serviços de streaming, proporcionando aos espectadores uma experiência mais personalizada.

Digamos que você seja um fã de Matrix e tenha visto os filmes inúmeras vezes. Você só quer ver as cenas de ação. Isso permitiria que você fizesse isso.

Existem benefícios sociais também. No futuro, e isso está em nossa agenda, poderíamos anotar filmes por violência ou coisas impróprias para crianças. Se uma família está assistindo a um filme, todos estão curtindo, mas se houver uma cena que possa perturbar o visualizador mais jovem, o algoritmo poderá identificar isso. Muito do nosso dia é gasto olhando para esses dados e tentando treinar algoritmos para aprender com isso.

Mantendo o conjunto de dados

Também precisamos ler muito sobre o que está acontecendo em outro lugar. A maior parte do meu dia vai para a leitura dos artigos que outros estão escrevendo sobre suas pesquisas. Como cientista de dados, você não quer ficar para trás. Você também precisa entender o que está acontecendo no mundo, então eu leio muito os jornais também.

Boa pesquisa acontece na interseção de campos, então eu também posso ler artigos de psicologia ou de ciência comportamental, assim como os de IA. Há muitos aspectos comportamentais na publicidade, por isso, se você quiser introduzir a IA, você precisa entender como as pessoas reagem às coisas. Nós também escrevemos nossa própria pesquisa. Nosso grupo escreve entre cinco e dez trabalhos por ano e participa de várias conferências.

Nós nos reunimos semanalmente e trocamos idéias, mas informalmente nós interagimos quase diariamente durante o almoço ou apenas passando casualmente pela mesa de alguém. Às vezes, um de nós pode realmente querer fazer algo que pareça realmente interessante, mas pode não pagar dividendos imediatamente. Então esse é o meu trabalho como gerente do grupo, tenho que responder sobre qual pesquisa devemos seguir.

A importância da criatividade

Normalmente termino o trabalho às seis horas e, na maior parte do tempo, vou direto para o ensaio, que pode durar até a meia-noite.

Meu dia é um continuum de entretenimento, IA e arte se unindo. Eu quase não faço distinção entre os dois. Se eu pensar em uma peça de teatro e precisar anotar o esquema, farei isso imediatamente. E se eu estou trabalhando em uma produção, e uma ideia me surpreende sobre o meu trabalho de IA, eu entro nisso.

Você precisa dessa criatividade em ciência de dados. Quando você está preso a um problema, você tem que encontrar várias maneiras de sair desse problema. É o mesmo quando você está dirigindo peças, você precisa olhar para o que está escrito e imaginar cinco maneiras diferentes pelas quais ele poderia ser interpretado.

Ser um cientista de dados "bom"

Você precisa ter uma boa noção do problema em questão e entender o que seu trabalho produzirá e como isso ajudará. Digamos, por exemplo, eu estou trabalhando em um algoritmo que pode detectar câncer a partir de exames de pacientes, eu preciso entender o que a precisão do algoritmo realmente significa. Eu posso escrever um artigo dizendo que eu melhorei os resultados de 95% de precisão para 96,3%, mas o que isso realmente significa em termos de salvar uma vida? São outras duas ou trezentas vidas salvas?

É muito importante entender os números e as tendências e como as coisas afetam umas às outras, em vez de apenas serem sugadas pelos algoritmos. Você precisa fazer sentido fora deles. A nova onda de algoritmos, que é o aprendizado profundo, geralmente não apresenta respostas que possam ser explicadas. Então você precisa entender se está tudo bem para você.

Isso também faz parte das considerações éticas sobre ciência de dados. De certa forma, você pode comparar a ciência de dados ao fogo. Em algum momento, alguém inventou fogo que pode ser usado para coisas realmente boas, ou coisas realmente ruins. O mesmo pode ser dito de AI, pode ser usado para diagnóstico de câncer ou pode ser usado para armamento.

Alguns podem dizer que não vão se preocupar com essas coisas porque é a ciência com a qual se importam. Mas alguém, em algum lugar, tem que se preocupar. Até mesmo alguém como Elon Musk, que é um grande defensor da IA, também alerta as pessoas sobre os efeitos negativos que isso pode ter no futuro. É sobre tentar colocar verificações e balanços em como usá-lo por uma boa causa.

 

Worker looking at a laptop graphics Free Photo