Universidad de Burgos RIUBU Principal Default Universidad de Burgos RIUBU Principal Default
  • español
  • English
  • français
  • Deutsch
  • português (Brasil)
  • italiano
Universidad de Burgos RIUBU Principal Default
  • Ayuda
  • Contacto
  • Sugerencias
  • Acceso abierto
    • Archivar en RIUBU
    • Acuerdos editoriales para la publicación en acceso abierto
    • Controla tus derechos, facilita el acceso abierto
    • Sobre el acceso abierto y la UBU
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Listar

    Todo RIUBUComunidadesFechaAutor / DirectorTítuloMateria / AsignaturaEsta colecciónFechaAutor / DirectorTítuloMateria / Asignatura

    Mi cuenta

    AccederRegistro

    Estadísticas

    Ver Estadísticas de uso

    Compartir

    Ver ítem 
    •   RIUBU Principal
    • E-Prints y Datos de investigación
    • Grupos de investigación
    • Biología, Educación y Salud con Tecnologías Avanzadas Informáticas (BEST-AI)
    • Artículos BEST-AI
    • Ver ítem
    •   RIUBU Principal
    • E-Prints y Datos de investigación
    • Grupos de investigación
    • Biología, Educación y Salud con Tecnologías Avanzadas Informáticas (BEST-AI)
    • Artículos BEST-AI
    • Ver ítem

    Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10259/6206

    Título
    Approx-SMOTE: Fast SMOTE for Big Data on Apache Spark
    Autor
    Juez Gil, MarioAutoridad UBU Orcid
    Arnaiz González, ÁlvarAutoridad UBU Orcid
    Rodríguez Diez, Juan JoséAutoridad UBU Orcid
    López Nozal, CarlosAutoridad UBU Orcid
    García Osorio, CésarAutoridad UBU Orcid
    Publicado en
    Neurocomputing. 2021, V. 464, p. 432-437
    Editorial
    Elsevier
    Fecha de publicación
    2021-11
    ISSN
    0925-2312
    DOI
    10.1016/j.neucom.2021.08.086
    Resumen
    One of the main goals of Big Data research, is to find new data mining methods that are able to process large amounts of data in acceptable times. In Big Data classification, as in traditional classification, class imbalance is a common problem that must be addressed, in the case of Big Data also looking for a solution that can be applied in an acceptable execution time. In this paper we present Approx-SMOTE, a parallel implementation of the SMOTE algorithm for the Apache Spark framework. The key difference with the original SMOTE, besides parallelism, is that it uses an approximated version of k-Nearest Neighbor which makes it highly scalable. Although an implementation of SMOTE for Big Data already exists (SMOTE-BD), it uses an exact Nearest Neighbor search, which does not make it entirely scalable. Approx-SMOTE on the other hand is able to achieve up to 30 times faster run times without sacrificing the improved classification performance offered by the original SMOTE.
    Palabras clave
    SMOTE
    Imbalance
    Spark
    Big data
    Data mining
    Materia
    Informática
    Computer science
    URI
    http://hdl.handle.net/10259/6206
    Versión del editor
    https://doi.org/10.1016/j.neucom.2021.08.086
    Aparece en las colecciones
    • Artículos BEST-AI
    Attribution-NonCommercial-NoDerivatives 4.0 Internacional
    Documento(s) sujeto(s) a una licencia Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Internacional
    Ficheros en este ítem
    Nombre:
    Juez-neurocomputing_2021.pdf
    Tamaño:
    1.019Mb
    Formato:
    Adobe PDF
    Thumbnail
    Visualizar/Abrir

    Métricas

    Citas

    Academic Search
    Ver estadísticas de uso

    Exportar

    RISMendeleyRefworksZotero
    • edm
    • marc
    • xoai
    • qdc
    • ore
    • ese
    • dim
    • uketd_dc
    • oai_dc
    • etdms
    • rdf
    • mods
    • mets
    • didl
    • premis
    Mostrar el registro completo del ítem