Hercules och hans kollegors arbete är kopplat till ett forskningsprojekt på Karolinska Universitetssjukhuset, och de medicinska textmassor som används där. På sikt är förhoppningen att textmassor som pseudonymiseras ska kunna användas mer brett av forskare. Även företag som samlar in kundomdömen med anonymitetskrav kan använda den här typen av program.
Hercules berättar att det handlar om att hitta och klassificera olika entiteter som personnamn, organisationer, platser, tidsuttryck och liknande i en text. Uppgifter som inte får riskera att halka med när forskare använder sig av materialet, eller om det används för att träna en AI. Han tror också att det här är ett område där det kommer att röra rejält på sig.
– Om några år har vi riktigt bra system för det här, det är jag övertygad om, säger Hercules.