Book cover: Clinical text mining
"Clinical text mining", ny lärobok författad av Hercules Dalianis vid Stockholms universitet.

Den första boken om klinisk textmining är nu publicerad. Boken heter ”Clinical text mining: Secondary use of electronic patients records”, är utgiven av förlaget Springer år 2018 och är författad av professor Hercules Dalianis vid Institutionen för data- och systemvetenskap (DSV). Boken är på engelska och finns tillgänglig som Open Access på https://www.springer.com.

Boken skrevs då det saknades en bok - och speciellt en lärobok - inom forskningsområdet klinisk textmining, som innebär att från den stora mängd elektroniska patientjournaler som skrivs idag extrahera ny information, speciellt från den ostrukturerade delen i  patientjournalen, den fria texten. En patientjournal skrivs av läkare och annan vårdpersonal  för beskriva symptom, diagnos och behandling av en patient, men journalen återanvänds sällan. Det finns mycket värdefull information i en patientjournal, som information om biverkningar av läkemedel, vårdrelaterade infektioner, vårdskador och andra oönskade händelser men också tidiga symptom på cancer och komorbiditeter, samsjukligheter. Att kunna detektera och prediktera dessa händelser och fakta kan förbättra sjukvården för många patienter. Metoderna för göra klinisk textmining bygger på språkteknologi och maskininlärning.

Boken baseras på över 10 års forskning främst på svenska patientjournaler utförd av ”Clinical Text Mining Group” på DSV samt på 100-tals andra internationella forskares arbete. 

Boken går igenom patientjournalens historia från de gamla egyptierna till dagens digitala journaler som kan bearbetas maskinellt. Den förklarar de olika medicinska klassifikationerna och terminologierna som ICD-diagnoskoder, ATC-läkemedelskoder, MeSH, UMLS och SNOMED CT. Vidare beskriver boken datorlingvistiska metoder för att bearbeta klinisk text som är svårbearbetad på grund av att den ej innehåller fullständiga meningar, ej standardiserad stavning av medicinska termer på grekiska och latin samt ej standardiserade förkortningar men också på grund av att den innehåller många felstavningar. En del av boken beskriver de etiska och säkerhetsmässiga aspekterna av att arbeta med klinisk text eftersom den innehåller känslig information om patienterna som ej får avslöjas. Boken beskriver slutligen ett stort antal tillämpningar inom området där elektroniska patientjournaler används som indata.