Text mining för cancerforskning och riskbedömning

CRAB, CHAT och LION-projekten utvecklar datorbaserad metodik för cancerforskning och cancerriskbedömning. Projekten är ett samarbete med Language Technology Lab at University of Cambridge (UK) och ger nya verktyg som stödjer riskbedömare och forskare i hanteringen av stora mängder text. Verktygen använder text-mining-teknik och ”literature-based discovery”, områden inom datavetenskapen som kan upptäcka ”dold” kunskap genom att automatiskt extrahera information från den skrivna texten i miljontals artiklar. Vi utvecklar och integrerar teknikerna i de tre verktygen CRAB, CHAT och LION. De ska bidra till effektiv hantering av information om cancer och cancerrisker. LION kan också upptäcka ”nya” samband i stora mängder artiklar och ge forskningshypoteser. LION-projektet är ett samarbete med Language Technology Lab at University of Cambridge (UK) och the Cancer Research UK Cambridge Institute, Narita Group (UK).

Länkar till projekten:

  • CRAB – Analyserar och klassificerar litteratur för cancerrisk-bedömning
  • CHAT – Klassificerar litteratur enligt ”hallmarks of cancer”-konceptet
  • LION-LBD – “literature based- discovery” tool för generering av nya hypoteser inom cancerbiologi

Kontakt

Ulla Stenius

Professor

Publikationer

LION LBD: a literature-based discovery system for cancer biology.
Pyysalo S, Baker S, Ali I, Haselwimmer S, Shah T, Young A, et al
Bioinformatics 2019 05;35(9):1553-1561

AI system accelerates search for cancer discoveries.
Technology Networks, November 28, 2018.

Cancer Hallmarks Analytics Tool (CHAT): a text mining approach to organize and evaluate scientific literature on cancer.
Baker S, Ali I, Silins I, Pyysalo S, Guo Y, Högberg J, et al
Bioinformatics 2017 Dec;33(24):3973-3981

Text mining for improved exposure assessment.
Larsson K, Baker S, Silins I, Guo Y, Stenius U, Korhonen A, et al
PLoS ONE 2017 ;12(3):e0173132

Grouping chemicals for health risk assessment: A text mining-based case study of polychlorinated biphenyls (PCBs).
Ali I, Guo Y, Silins I, Högberg J, Stenius U, Korhonen A
Toxicol. Lett. 2016 Jan;241():32-7

Automatic semantic classification of scientific literature according to the hallmarks of cancer.
Baker S, Silins I, Guo Y, Ali I, Högberg J, Stenius U, et al
Bioinformatics 2016 Feb;32(3):432-40

Evaluation of carcinogenic modes of action for pesticides in fruit on the Swedish market using a text-mining tool.
Silins I, Korhonen A, Stenius U
2014 ;5():145

Active learning-based information structure analysis of full scientific articles and two applications for biomedical literature review.
Guo Y, Silins I, Stenius U, Korhonen A
Bioinformatics 2013 Jun;29(11):1440-7

Text mining for literature review and knowledge discovery in cancer risk assessment and research.
Korhonen A, Séaghdha DO, Silins I, Sun L, Högberg J, Stenius U
PLoS ONE 2012 ;7(4):e33427

Data and literature gathering in chemical cancer risk assessment.
Silins I, Korhonen A, Högberg J, Stenius U
Integr Environ Assess Manag 2012 Jul;8(3):412-7

Weakly supervised learning of information structure of scientific abstracts--is it accurate enough to benefit real-world tasks in biomedicine?
Guo Y, Korhonen A, Silins I, Stenius U
Bioinformatics 2011 Nov;27(22):3179-85

A comparison and user-based evaluation of models of textual information structure in the context of cancer risk assessment.
Guo Y, Korhonen A, Liakata M, Silins I, Hogberg J, Stenius U
BMC Bioinformatics 2011 Mar;12():69

Identifying the information structure of scientific abstracts: An investigation of three different schemes.
Guo Y, Sun L, Korhonen A, Liakata M, Silins I, Sun L and Stenius U (2010).
In Proceedings of Bio-Natural Language Processing (BioNLP) Uppsala, Sweden.

The first step in the development of Text Mining technology for Cancer Risk Assessment: identifying and organizing scientific evidence in risk assessment literature.
Korhonen A, Silins I, Sun L, Stenius U
BMC Bioinformatics 2009 Sep;10():303

User-Driven Development of Text Mining Resources for Cancer Risk Assessment.
Sun L, Korhonen A, Silins I, and Stenius U. (2009).
In Proceedings of the Natural Language Processing in Biomedicine (BioNLP) 2009. Boulder, Colorado.

A New Challenge for Text Mining: Cancer Risk Assessment.
Lewin I, Silins I, Korhonen A, Hogberg J and Stenius U. (2008).
In Proceedings of the ISMB BioLINK Special Interest Group on Text Data Mining. Toronto, Canada.