Generando ideas únicas para proyectos de ciencia de datos en 5 pasos

Probablemente, la parte más difícil de cualquier proyecto de ciencia de datos es tener una idea original pero factible. Un experto que busque una idea así puede caer fácilmente en la "trampa del conjunto de datos". Pasa muchas horas examinando conjuntos de datos existentes y tratando de encontrar nuevas ideas interesantes. Pero este enfoque tiene un problema. El hecho es que alguien que solo mira conjuntos de datos existentes (con Kaggle , Google Datasets , FiveThirtyEight ) limita su creatividad al ver solo un pequeño conjunto de tareas en las que se enfocan los conjuntos de datos que estudian.



A veces me gusta explorar los conjuntos de datos que me interesan. Si construyo un modelo exitoso para los datos de Kaggle, para el cual ya se han creado innumerables modelos, no habrá valor práctico, pero al menos me permitirá aprender algo nuevo. Pero los científicos de datos son personas que se esfuerzan por crear algo nuevo, único, algo que pueda aportar un beneficio real al mundo.







¿Cómo generas nuevas ideas? Para encontrar la respuesta a esta pregunta, combiné mi propia experiencia y los resultados de la investigación sobre creatividad. Esto llevó al hecho de que pude formular 5 preguntas, cuyas respuestas ayudan a encontrar nuevas ideas. Aquí también daré ejemplos de ideas encontradas gracias a la metodología que propuse. Mientras busca respuestas a las preguntas que se presentan aquí, recorrerá el camino de generar nuevas ideas y podrá utilizar su potencial creativo al máximo. Como resultado, tendrá nuevas ideas únicas que puede implementar en sus proyectos de ciencia de datos.



1. ¿Por qué quiero empezar a trabajar en un nuevo proyecto?



Cuando piensas en comenzar un nuevo proyecto, tienes una intención u objetivo en tu cabeza. Primero, debe encontrar la respuesta a la pregunta de por qué desea crear otro proyecto en el campo de la ciencia de datos. Tener un esquema general del tipo de objetivo que persigue le ayudará a concentrarse en encontrar una idea. Así que piensa para qué vas a crear un proyecto. A continuación se muestran algunas opciones:



  • Este es un proyecto de cartera que presentará a empleadores potenciales.
  • Este es un borrador de un artículo sobre conceptos, modelos o análisis de datos exploratorios.
  • Este es un proyecto que te permitirá practicar algo. Por ejemplo, podemos hablar sobre el procesamiento del lenguaje natural, sobre la visualización de datos, sobre el procesamiento de datos primarios, sobre algún algoritmo específico de aprendizaje automático.
  • Este es un proyecto muy especial que no se describe en esta lista.


2. ¿Qué áreas son mis intereses y mi experiencia?



Hay tres razones principales para pensar en esta cuestión.



  • Primero, recuerde los diagramas de Venn usados ​​en ciencia de datos para describir las habilidades requeridas en esta área. El conocimiento en un área específica es un activo importante que todo científico de datos debería tener. Es posible resolver ciertos problemas procesando datos solo si el área temática a la que pertenecen estos datos está clara. De lo contrario, se aplicarán algoritmos, se crearán visualizaciones y predicciones que parecerán inadecuadas para cualquier practicante del perfil adecuado. Y si lo que está haciendo no tiene sentido, ¿por qué molestarse en hacerlo?
  • -, , , , . , . , . , , .
  • -, , , . , , - . 


Dejame darte un ejemplo. Las áreas de conocimiento que me interesan y en las que tengo experiencia incluyen sostenibilidad ambiental y socioeconómica de los sistemas, finanzas, cultura popular, procesamiento del lenguaje natural. Centrarme en estos temas me ayuda a aprovechar lo que ya tengo. Gracias a este conocimiento, determino si puedo, inspirado en algo, proponer una nueva idea que se pueda implementar.



3. ¿Cómo encuentras inspiración?



La principal fuente de inspiración es la lectura. Mientras busca una idea, puede encontrar temas interesantes leyendo varios materiales:



  • , , . , , . , WIRED , , Google . , . , Google.
  • . , . , GPT-2 , , , , , , . - ?
  • . , , Data Science, , . , NLP- «», , , . - ? , ? GPT-2.


Si hablamos de otras fuentes de inspiración, entonces la inspiración, sin cerrarse a nuevas ideas, se puede encontrar en la vida cotidiana. Siempre que esté interesado en una pregunta, piense si puede responderla utilizando técnicas de manipulación de datos. Por ejemplo, recientemente me encontré con un avance de Boys y encontré muchas críticas positivas al respecto en IMDb. "¿Hay alguna confirmación de que el número de escenas violentas en los programas de televisión aumenta con el tiempo ?", Me preguntaba. "¿Existe una audiencia cada vez mayor que disfruta de los programas de televisión violentos?", Continué. Si algo te interesa, tómate un momento y estudia los datos relevantes.



¿Cómo genera ideas de proyectos a partir de las fuentes de inspiración anteriores? Los neurocientíficos han identificado tres procesos psicológicos distintos asociados con la generación de ideas:



  • Puede combinar ideas existentes para crear otras nuevas (creatividad combinatoria). Por ejemplo, varios proyectos analizaron ofertas de alquiler publicadas en Airbnb. Hay proyectos destinados a analizar el mercado inmobiliario. Si combina estas ideas, puede buscar una respuesta a la pregunta de si los precios de la vivienda en una determinada ciudad están aumentando gracias a Airbnb.
  • , ( ). , -, , , . , , - .
  • - , ( ). — . . . : , , .


4. ?



Una vez que haya decidido la dirección general de la investigación, deberá buscar datos que le permitan comprender cómo implementar su idea en forma de un proyecto de ciencia de datos. Esto es extremadamente importante para determinar si una idea tendrá éxito. Respondiendo a la pregunta del título de esta sección, debes considerar la posibilidad de tener lo que necesitas en los almacenes de datos existentes. Es posible que deba recopilar los datos necesarios usted mismo, lo que complica la tarea. Así que aquí hay una descripción general de las fuentes de datos:





Si no puede encontrar datos que puedan ayudarlo a implementar la idea de su proyecto, reformule la idea. Trate de obtener una idea de la idea original que se pueda implementar utilizando los datos que tenga. Mientras tanto, pregúntese por qué no puede encontrar los datos que necesita. ¿Qué ocurre en el área que le interesa? ¿Qué puedes hacer al respecto? Las respuestas a estas preguntas por sí solas pueden conducir al surgimiento de un nuevo proyecto de ciencia de datos.



5. ¿Es realizable la idea encontrada?



¡Entonces tienes una idea fantástica! ¿Pero es posible implementarlo? Repita los pasos del proceso de generación de ideas. Piensa en lo que quieres lograr (pregunta número 1), te interesa el área elegida, si tienes experiencia en ella (pregunta número 2), tienes los datos necesarios para implementar la idea (pregunta número 4). Ahora debe determinar lo siguiente: ¿tiene las habilidades necesarias para implementar la idea y lograr el objetivo?



Es importante tener en cuenta un factor como el tiempo que planea dedicar a este proyecto. Probablemente no va a escribir una tesis doctoral sobre el tema elegido. Por lo tanto, el proyecto que harás en el marco de la idea encontrada, quizás, afectará solo a una cierta parte de la misma. Tal vez solo consista en aprender algo nuevo, necesitas implementar la idea en el futuro.



Después de seguir los 5 pasos anteriores para generar una idea, debe tener una pregunta que pueda y quiera responder, dedicando todo el tiempo que esté dispuesto a dedicar a lograr su objetivo.



Salir



  • . , , , . — , , , . — . , , .
  • - . . , - , . , . , , , , .
  • No tenga miedo de empezar de nuevo. Hagas lo que hagas, siempre aprendes algo nuevo. Cada vez que escribe una línea de código, practica y amplía sus conocimientos y habilidades. Si te diste cuenta de que la implementación de la idea encontrada no te acercará a tu objetivo, o si resulta que la idea no es factible, no temas dejarla y seguir adelante. El tiempo que ha dedicado a buscar esta idea no lo ha perdido. Es necesario evaluar con sensatez los beneficios que se pueden obtener de la implementación de la idea.


Utilizando el método descrito aquí, encuentro constantemente ideas originales para mis proyectos de ciencia de datos. Espero que esta técnica también te sea útil.



¿Cómo busca nuevas ideas para sus proyectos de ciencia de datos?










All Articles