En marzo de 2022 se presentó un problema en el que Gerardo Fernández, de Virus Total presentó a estudiantes de la asignatura Laboratorio de Computación Científica de los grados GI Informática, GI Computadores, GI Software, una propuesta de proyecto sobre clasificación de malware.
Clasificación de malware. Es un problema general que existe en la industria. Salvo excepciones, cada casa antivirus bautiza una familia de malware con un nombre distinto. El proyecto consiste en, a partir de un dataset que os proporcionásemos, construir una solución que asigne el nombre más significativo a clusters de malware similares. La similitud debe estar enfocada a asignar el mismo nombre a muestras de una misma familia de malware. Para ello se pueden emplear nombres de veredictos, datos estructurales de los ficheros, datos del comportamiento en ejecución, desensamblado, etc.