Arnetminer - Arnetminer

ArnetMiner (también AMiner) es un servicio en línea gratuito que se utiliza para indexar, buscar y extraer grandes datos científicos.

Visión general

ArnetMiner (AMiner) está diseñado para buscar y realizar operaciones de minería de datos contra publicaciones académicas en Internet, utilizando análisis de redes sociales para identificar conexiones entre investigadores, conferencias y publicaciones. Esto le permite brindar servicios tales como búsqueda de expertos, búsqueda geográfica, análisis de tendencias, recomendación de revisor, búsqueda de asociaciones, búsqueda de cursos, evaluación del desempeño académico y modelado de temas.

ArnetMiner fue creado como un proyecto de investigación en análisis de influencia social, ranking de redes sociales y extracción de redes sociales. Se han publicado varios artículos revisados ​​por pares derivados del desarrollo del sistema. Lleva en funcionamiento más de tres años, y ha indexado 130.000.000 de investigadores y más de 265 millones de publicaciones. La investigación fue financiada por el Programa Nacional de Investigación y Desarrollo de Alta Tecnología de China y la Fundación Nacional de Ciencias de China .

ArnetMiner se usa comúnmente en el mundo académico para identificar relaciones y establecer correlaciones estadísticas entre la investigación y los investigadores. Ha atraído más de 10 millones de accesos IP independientes de 220 países y regiones. El producto se ha utilizado en la plataforma SciVerse de Elsevier y en conferencias académicas como SIGKDD, ICDM, PKDD, WSDM.

Operación

ArnetMiner extrae automáticamente el perfil del investigador de la web. Recopila e identifica las páginas relevantes, luego utiliza un enfoque unificado para extraer datos de los documentos identificados. También extrae publicaciones de bibliotecas digitales en línea utilizando reglas heurísticas.

Integra los perfiles de los investigadores extraídos y las publicaciones extraídas. Emplea el nombre del investigador como identificador. Se ha propuesto un marco probabilístico para abordar el problema de la ambigüedad de nombres en la integración. Los datos integrados se almacenan en una base de conocimientos de la red de investigadores (RNKB).

El otro producto principal en el área son Google Scholar, Scirus de Elsevier y el proyecto de código abierto CiteSeer.

Historia

Fue iniciado y creado por el profesor Jie Tang de la Universidad de Tsinghua , China. Se lanzó por primera vez en marzo de 2006. A continuación, se proporciona una lista de actualizaciones en los últimos años:

  • Marzo de 2006, versión 0.1, las funciones incluyen la creación de perfiles de investigadores, la búsqueda de expertos, la búsqueda de conferencias y la búsqueda de publicaciones. El sistema fue desarrollado en Perl;
  • Agosto de 2006, versión 1.0, el sistema se volvió a implementar en Java;
  • Julio de 2007, Versión 2.0. Las nuevas funciones incluyen la búsqueda de intereses de los investigadores, la búsqueda de asociaciones, la búsqueda de trabajos de encuestas (no disponible ahora);
  • Abril de 2008, versión 3.0, las nuevas funciones incluyen comprensión de consultas , nueva GUI y análisis de registro de búsqueda;
  • Noviembre de 2008, versión 4.0, las nuevas funciones incluyen búsqueda de gráficos, modelado de temas, extracción de información de financiación NSF / NSFC;
  • Abril de 2009, versión 5.0, las nuevas funciones incluyen edición de perfil, servicio de API abierta, búsqueda Bole, búsqueda de cursos (no disponible ahora);
  • Diciembre de 2009, versión 6.0, las nuevas funciones incluyen evaluación del desempeño académico, comentarios de los usuarios, análisis de conferencias;
  • Mayo de 2010, versión 7.0, las nuevas funciones incluyen desambiguación de nombres, recomendación del revisor del artículo, creación de ArnetPage;
  • Marzo de 2012, Versión II, renombrada como AMiner, reescribió todos los códigos y rediseñó la GUI. Las nuevas funciones incluyen: búsqueda geográfica, plataforma ArnetAPP.
  • Junio ​​de 2014, Versión II, renombrada como AMiner, reescribió todos los códigos y rediseñó la GUI. Las nuevas funciones incluyen: búsqueda geográfica, plataforma ArnetAPP.
  • Diciembre de 2015, se puso en línea una versión completamente nueva.
  • Mayo de 2017, la versión profesional se puso en línea.
  • Abril de 2018, las nuevas funciones incluyen Trend Analysis, una desambiguación de nombres basada en aprendizaje profundo

Recursos

ArnetMiner publicó varios conjuntos de datos con fines de investigación académica, incluido Open Academic Graph, DBLP + citation (un conjunto de datos que aumenta las citas en los datos DBLP del Digital Bibliography & Library Project ), Name Disambigation, Social Tie Analysis. Para obtener más conjuntos de datos y códigos fuente disponibles para la investigación, consulte.

Ver también

Referencias

  1. ^ Jie Tang; Jing Zhang; Limin Yao; Juanzi Li; Li Zhang; Zhong Su (2008). "ArnetMiner: extracción y minería de redes sociales académicas" . Actas de la 14ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos . Nueva York: ACM.
  2. ^ "Arnetminer: introducción" . Consultado el 17 de diciembre de 2020 .
  3. ^ "SciVerse - HUB - Inicio" . Archivado desde el original el 9 de septiembre de 2012 . Consultado el 24 de abril de 2012 .
  4. ^ "Análisis de tendencias" . Consultado el 24 de diciembre de 2018 .
  5. ^ Yutao Zhang; Fanjin Zhang; Peiran Yao; Jie Tang (2018). "Desambiguación de nombres en AMiner: agrupación, mantenimiento y humanos en el bucle" . Actas de la 24ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos . Londres: ACM.
  6. ^ "Gráfico académico abierto" . Consultado el 24 de diciembre de 2018 .
  7. ^ "Papeles DBLP + Relación de cita" . Consultado el 24 de diciembre de 2018 .
  8. ^ "Desambiguación de nombres" . Consultado el 24 de abril de 2012 .
  9. ^ "Inferir vínculos sociales en grandes redes" . Consultado el 24 de abril de 2012 .
  10. ^ "Datos abiertos y códigos de ArnetMiner" . Consultado el 24 de abril de 2012 .

enlaces externos

Otras lecturas

  • Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, Zhong Su. Arnetminer: extracción y minería de redes sociales académicas. In Proceedings of the 14th ACM SIGKDD international conference on Knowledge Discovery and Data mining (SIGKDD'2008)
  • Chi Wang, Jiawei Han , Yuntao Jia, Jie Tang , Duo Zhang, Yintao Yu y Jingyi Guo. Relaciones Asesor Minero-Asesor de Redes de Publicaciones de Investigación. En proceso de la Decimosexta Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (SIGKDD'2010).
  • Jie Tang , Jimeng Sun, Chi Wang y Zi Yang. Análisis de influencia social en redes a gran escala. En Actas de la Decimoquinta Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (SIGKDD'2009). págs. 807–816.
  • Jie Tang , Ruoming Jin y Jing Zhang. Un enfoque de modelado de temas y su integración en el marco de caminata aleatoria para la búsqueda académica. En Actas de la Conferencia Internacional IEEE sobre Minería de Datos de 2008 (ICDM'2008). págs. 1055–1060.
  • Jie Tang , Limin Yao, Duo Zhang y Jing Zhang. Un enfoque combinado para la creación de perfiles de usuarios web. ACM Transactions on Knowledge Discovery from Data (TKDD), (vol. 5, núm. 1), artículo 2 (diciembre de 2010), 44 páginas.
  • Yutao Zhang, Fanjin Zhang, Peiran Yao y Jie Tang . Desambiguación de nombres en AMiner: agrupación, mantenimiento y humanos en el bucle. En Actas de la Vigésimo Cuarta Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (KDD'18). págs. 1002-1011.