Buscadores como Google o Bing, ofrecen resultados que presentan coincidencias con el sentido literal de la búsqueda realizada, en combinación con factores manejados por su propio algoritmo.
Con el fin de desarrollar una opción que brinde resultados más precisos, dotando de exposición incluso a aquellos que a pesar de relacionarse con los términos de búsqueda no figuran entre los primeros, investigadores de la Universidad Cornell, desarrollaron un sistema de clasificación más justo para búsquedas que pueden ir, desde hoteles hasta ofertas de empleo y contenido audiovisual.
Nueva alternativa para ofrecer mejores resultados en buscadores
El nuevo sistema de clasificación presentado por el equipo de Cornell se encarga de ofrecer resultados relevantes, pero divide la atención del usuario de manera más equitativa entre los resultados de búsqueda. Se puede aplicar a mercados en línea como sitios de viajes, plataformas de contratación y agregadores de noticias.
Los sistemas que gestionan los resultados que arroja un buscador, por lo general se encargan de clasificar los contenidos a mostrar según lo que los usuarios quieren ver. Sin embargo, en la práctica, muchos artículos reciben posiciones bajas en la lista, de manera injusta. Bajo esta dinámica, sitios de contenido y calidad similar pueden terminar muy separados en las clasificaciones, accediendo en casos a una exposición casi nula.
«En los sistemas de recomendación y los motores de búsqueda, quien obtiene una clasificación alta obtiene un gran beneficio de eso», dijo Thorsten Joachims, profesor de ciencias de la computación y ciencias de la información en Cornell. “La atención del usuario es un recurso limitado y necesitamos distribuirlo equitativamente entre los elementos”, agregó.
Para subsanar esta situación, Yuta Saito, estudiante de doctorado en el campo de las ciencias de la computación en Cornell, desarrolló un sistema de clasificación mejorado, inspirándose en ideas tomadas de la teoría económica. Para esto, aplicó el principio de «división justa«, aplicada para repartir recursos limitados de la manera más justa posible entre los miembros de un grupo.
La división justa de los resultados se define en base a tres criterios: el beneficio de cada elemento de estar clasificado en la plataforma es mejor que ser descubierto al azar; el impacto de ningún elemento, como los ingresos, puede mejorarse fácilmente; y ningún elemento obtendría una ventaja al cambiar su clasificación en comparación con otros elementos en una serie de búsquedas.
La puesta en práctica de este principio se probó con una muestra de datos sintéticos y otra de datos del mundo real, consiguiendo demostrar efectivamente la viabilidad del sistema propuesto.
«Redefinimos la equidad en la clasificación por completo», dijo Saito. «Se puede aplicar a cualquier tipo de sistema de clasificación de dos caras», agregó.
Ilustrando el impacto de este sistema, el equipo planteó como ejemplo su aplicación en YouTube. En este caso, el sistema de recomendación presentaría un flujo de vídeos más variado, lo que podría distribuir las ganancias de manera más uniforme entre los creadores de contenido. «Queremos satisfacer a los usuarios de la plataforma, por supuesto, pero también debemos ser justos con los creadores de videos, para mantener su diversidad a largo plazo», dijo Saito.
En otras áreas de uso, como en las plataformas de empleos, este sistema podría diversificar los resultados de búsqueda con resultados más precisos, en lugar de mostrar siempre las ofertas destacadas o más populares que se muestran por defecto. De igual forma, extrapolando esta técnica a otras áreas, podría usarse también para mejorar las recomendaciones de películas en plataformas de streaming, facilitar la búsqueda de contenido relevante en conferencias e incluso, acceder a una selección más equilibrada de noticias curadas.
El detalle técnico de esta propuesta fue presentado en la publicación “Fair Ranking as Fair Division: Impact-Based Individual Fairness in Ranking”, desprendida del evento “Proceedings of the 2022 Association for Computing Machinery Special Interest Group on Knowledge Discovery and Data Mining Conference”.
Fuente info
Autor: Nicolás Verdejo