About
Ecuador
Home > Blogs >

Un día en la vida de un científico de datos.

Data

¿Alguna vez te has preguntado qué hace un científico de datos todo el día? ¿De qué se preocupan y adónde los llevan su trabajo? Niranjan Pedanekar es científico principal de Tata Consultancy Services (TCS) Research. Aquí él da una idea de un día típico en la oficina y revela que no se trata solo de datos crujidos ...

Me levanto alrededor de las 7.30 am y me dirijo directamente a la oficina. Estoy a cargo de un grupo llamado Área 66. Todos somos científicos de datos y todos tenemos diferentes niveles de experiencia.

Reuní a este grupo hace aproximadamente dos años porque estaba realmente interesado en el entretenimiento y en cómo los humanos se involucran con él. También soy dramaturgo, actor y director, por lo que también lucho con estas mismas preguntas en mi trabajo allí.

Lo que mi equipo hace se encuentra en algún lugar entre la investigación académica y el trabajo de la industria y se encuentra en la intersección entre el entretenimiento, la ciencia de la información y la ciencia del comportamiento.

Actualmente estamos estudiando las aplicaciones de AI para las industrias de entretenimiento, medios y publicidad. Escribimos algoritmos que nos permiten anotar los medios de varias maneras automáticamente.

Tomemos películas, por ejemplo. Estamos tratando de construir un algoritmo que pueda reconocer las diferentes intensidades emocionales dentro de una película. Por lo tanto, una secuencia de acción es de alta intensidad, pero una escena donde las personas se sientan en una sala de reuniones y hablan es de baja intensidad. Los datos que utilizamos para esto son cosas como la paleta de colores, la música y la velocidad de la acción en una secuencia.

Trayendo la IA al cine

Quizás te preguntes por qué hacemos esto. Bueno, hay varias aplicaciones para ello. Una es la colocación de anuncios, que a veces se pueden interrumpir con la acción de la película. Puede que tengas una escena realmente seria, seguida de un anuncio lleno de gente bailando, y luego vuelves a la película sombría.

Nuestra tecnología permitiría que los anuncios coincidan con el estado de ánimo de la película: un anuncio de una bebida después de una escena ambientada en el desierto o un anuncio de zapatillas de deporte después de una escena en la que hay gente corriendo.

Además, estamos analizando cómo realizar anotaciones en función de la configuración. Por lo tanto, sería capaz de distinguir entre una escena de persecución en un bosque y una escena tranquila en la playa. Esto podría ayudar a Netflix, Amazon y otros servicios de transmisión, a brindar a sus espectadores una experiencia más personalizada.

Digamos que eres un fanático de Matrix y que has visto las películas innumerables veces, solo quieres ver las escenas de acción. Esto te permitiría hacer eso.

Hay beneficios sociales también. En el futuro, y esto está en nuestra agenda, podríamos anotar películas por violencia o cosas inadecuadas para los niños. Si una familia está viendo una película, todos están disfrutando, pero si hay una escena que podría molestar al espectador más joven, el algoritmo podría detectar eso. Pasamos gran parte de nuestro día mirando tales datos y tratando de entrenar algoritmos para aprender de ellos.

Mantenerse al día con el conjunto de datos

También necesitamos leer mucho sobre lo que está sucediendo en otros lugares. La mayor parte de mi día se dedica a leer los artículos que otros escriben sobre su investigación. Como científico de datos, no querrás quedarte atrás. También necesitas entender lo que está pasando en el mundo, así que también leo mucho los periódicos.

Una buena investigación ocurre en la intersección de campos, por lo que también podría leer artículos de psicología o ciencia del comportamiento, así como otros de inteligencia artificial. Hay muchos aspectos de comportamiento en la publicidad, por lo que si desea introducir AI en ella, debe comprender cómo reacciona la gente ante las cosas. También escribimos nuestra propia investigación. Nuestro grupo escribe entre cinco y 10 artículos al año y asiste a tantas conferencias.

Nos reunimos semanalmente e intercambiamos ideas, pero de manera informal interactuamos casi a diario durante el almuerzo o simplemente pasamos por el escritorio de alguien. A veces, uno de nosotros puede querer realmente hacer algo que parezca realmente interesante, pero puede que no pague inmediatamente dividendos. Así que ese es mi trabajo como gerente del grupo, tengo que responder a qué investigación debemos realizar.

La importancia de la creatividad.

Por lo general, termino de trabajar a las seis en punto y, la mayoría de las veces, voy directamente a un ensayo, que puede durar hasta la medianoche.

Mi día es un continuo de entretenimiento, inteligencia artificial y arte que se unen. Casi no distingo entre los dos. Si pienso en una idea de juego y necesito anotar el esquema, lo haré de inmediato. Y si estoy trabajando en una producción, y una idea me llama la atención de mi trabajo de IA, me pongo a ello.

Necesitas esa creatividad en la ciencia de datos. Cuando estás atrapado con un problema, tienes que encontrar varias maneras de salir de ese problema. Es lo mismo cuando diriges jugadas, necesitas mirar lo que está escrito e imaginar cinco formas diferentes en las que podría interpretarse.

 

Ser un "buen" científico de datos

Debe tener un buen conocimiento del problema en cuestión y comprender qué producirá su trabajo y cómo ayudará. Digamos, por ejemplo, que estoy trabajando en un algoritmo que puede detectar el cáncer a partir de las exploraciones de los pacientes, necesito entender lo que realmente significa la precisión del algoritmo. Puedo escribir un artículo diciendo que mejoré los resultados del 95% de precisión al 96.3%, pero ¿qué significa eso en términos de salvar una vida? ¿Son otras doscientas o trescientas vidas salvadas?

Es muy importante poder entender los números y las tendencias y cómo las cosas se afectan unas a otras, en lugar de simplemente ser absorbidas por los algoritmos. Necesitas darle sentido a ellos. La nueva ola de algoritmos, que es el aprendizaje profundo, a menudo no da respuestas que puedan explicarse. Entonces necesitas entender si eso está bien para ti.

Eso es parte de las consideraciones éticas sobre la ciencia de datos también. De alguna manera puedes comparar la ciencia de datos con el fuego. En algún momento, alguien inventó el fuego que puede usarse para cosas realmente buenas o cosas realmente malas. Lo mismo se puede decir de la IA, se puede usar para el diagnóstico de cáncer o se puede usar para armamento.

Algunos podrían decir que no van a preocuparse por esas cosas porque es la ciencia que les importa. Pero alguien, en algún lugar tiene que preocuparse. Incluso alguien como Elon Musk, que es un gran defensor de la IA, también advierte a las personas sobre los malos efectos que podría tener en el futuro. Se trata de tratar de poner cheques y balances en cómo usarlo para una buena causa.

 

Worker looking at a laptop graphics Free Photo