SERP: Mejora del algoritmo para mercados utilizando inteligencia artificial

Una plataforma universal para la creación de marketplaces, adecuada para proyectos comerciales completamente diferentes, desde tiendas de abarrotes hasta servicios de contratación, requiere una mejora constante, ya que los crecientes requisitos de los servicios en línea hoy en día ya requieren el trabajo de la inteligencia artificial. Y la satisfacción del cliente con los resultados de búsqueda y, en consecuencia, el éxito del negocio, depende de la correcta configuración de los sistemas de IA.





Como ejemplo, podemos tomar la búsqueda contextual utilizada en los motores de búsqueda. Todos los motores de búsqueda intentan ganar la competencia y mejorar la calidad de las búsquedas, pero en un mundo que cambia rápidamente, el significado de las expresiones verbales puede cambiar significativamente. Por ejemplo, al solicitar la palabra "feed", el motor de búsqueda anteriormente ofrecía el resultado "cinta de raso", mientras que ahora los resultados de búsqueda muestran información sobre una cadena de tiendas y un portal de información. Pero la inteligencia artificial viene al rescate en la emisión de resultados, lo que ayuda a corregir los resultados en un tiempo récord.





Digamos que un fragmento de texto define la palabra "cinta" como parte de un paquete bonito. Para simplificar, clasificamos todos los significados de esta palabra sin aclarar, por ejemplo, debido a las redes ultraprecisas: redes neuronales convolucionales (CNN). Esta arquitectura de CNN utiliza el llamado conjunto de redes ultraprecisas y recurrentes y en la salida da una definición relevante de la palabra "cinta" basada en el contenido semántico del texto. Los datos de entrada son una matriz con una altura fija  n. Además, cada fila es un mapeo vectorial del identificador, es decir, palabras en el espacio de características de dimensión  k... Para crear un espacio de características, es conveniente utilizar las herramientas de semántica de distribución FastText, Glove, Word2mVec. La matriz se procesa mediante filtros con un ancho fijo, que son iguales a la dimensión del espacio de características. Para seleccionar sus tamaños, se selecciona el parámetro de la altura de las filas adyacentes h . En consecuencia, el tamaño de la matriz de salida depende de la altura del filtro y la matriz original. Después de esta etapa, el mapa de características se procesa mediante una capa de submuestreo, lo que reduce la dimensión del mapa de características generado, se asigna para cada convolución y se extrae la información dominante. Luego, los mapas de características se combinan en un vector de características, que se incluye en el cálculo de las etiquetas de clase finales.





, , , . , . CBOW, , . : softmax – , , . , k . (2k+1). .





skip-gram, , , .





, . , , – , , , – . : -, -. – , .





, – , , , 5 .





-

. , , , , .





, 45 , , , . , , . «», , , , , .





. , . , .  . , . «» . . Negative Sampling. «» :





s (x, ω)

, , :





s (x, ω)

  .





-s (x, ω)

– .





. .





Una combinación equilibrada de algoritmos de clasificación mejorará la calidad de todo el sistema. Pero no debemos olvidarnos de las excepciones, porque el sistema de clasificación de Google ha señalado que su motor de búsqueda aún no está listo para confiar finalmente la clasificación a los algoritmos de aprendizaje automático. Los modelos generados automáticamente pueden comportarse de manera impredecible en nuevas clases de consultas que no son como consultas del conjunto de entrenamiento en comparación con los modelos creados por expertos humanos.








All Articles