自然语言处理 NLP
为了改善自然语言处理分析,Keras360制定了一个专门为临床研究设计的词汇库。词汇按照相关主题系统地组织。请参考您团队计划用于Delphi-NLP情感分析的次级词汇,也称为临床研究的主题。
文本挖掘、权重词语
自2024年R1以来,Keras360对截至提取日期的至少五年内的科学文献进行了彻底审查。除了呈现提取的独特词汇总数外,每个表格的最后一列还包含根据非中立性权重分类的词汇,用于自然语言处理。我们的搜索基于我们的辅助词汇及其相应的定制搜索词。有关临床词汇库的更多信息,请通过电子邮件与我们联系: contact.general@keras360.io
- 一级辅助权重词语 (主库)
临床,经济学,计算机科学,生物医学工程 - 二级辅助权重词语
Secondary Lexicon。请参考以下 R3表格。
最新文本挖掘日期
2025年9月1日(轮次,R3)
第三轮 (R3)
在 R3 中,已经将 12 个新的辅助词库纳入搜索中,具体体现从 CAR-T 到 Cardiovascular 心血管; 粗体字母。结果基于随机对照试验 (RCT) 和临床试验,唯一的例外是 Disease Diagnosis “疾病诊断”搜索标准。
Keras360临床词汇库目前拥有41个二级词汇,即主题。以下表格也可下载于PDF。
| Secondary Lexicons | Unique Lexicons | Non-neutral Lexicons |
| CAR-T | 18,457 | 6,856 |
| insurance | claims | 147,880 | 54,578 |
| dental | oral health | 943,233 | 318,882 |
| osseointegration | 150,319 | 49,669 |
| radiotherapy | 126,085 | 43,919 |
| rare diseases | 32,564 | 11,281 |
| lymphedema | 18,549 | 6,716 |
| imaging scans | 988,788 | 326,210 |
| palliative care | 90,203 | 35,842 |
| aging | senescence | 214,333 | 77,674 |
| bridging | consolidative therapy | 8,235 | 2,982 |
| cardiovascular | 411,111 | 143,194 |
| transplant | 424,914 | 148,151 |
| disease.severity | 535,926 | 193,310 |
| pain | 1,053,362 | 374,892 |
| adverse.event | 865,867 | 298,560 |
| dose.response | 594,348 | 200,959 |
| waiting.list | 51,183 | 20,463 |
| switch.regimen | 24,887 | 8,634 |
| vaccination | 268,748 | 90,829 |
| AI | 117,626 | 42,638 |
| neurodegenerative | 157,109 | 54,916 |
| Gastrointestinal (GI) | 370,333 | 127,001 |
| chemotherapy | immunotherapy | 530,377 | 187,558 |
| cost benefit | 232,289 | 85,360 |
| cost utility | 33,207 | 12,226 |
| ocular | 41,574 | 14,210 |
| disease.diagnosis | 1,868,281 | 647,889 |
| STD | 304,013 | 105,211 |
| reproductive | 192,250 | 64,336 |
| family.planning | 46,636 | 15,708 |
| renal.failure | 707,734 | 245,815 |
| nutrition | 771,118 | 270,493 |
| obesity | 423,083 | 150,169 |
| personality.disorder | 33,245 | 13,662 |
| precision.medicine | 185,131 | 71,840 |
| psychology | 68,792 | 28,281 |
| reconstructive | 112,715 | 39,808 |
| QOL | 1,150,468 | 432,305 |
| statistics | 580,666 | 206,474 |
| wounds | 409,917 | 143,327 |
| Total | 15,305,556 | 5,372,828 |
注意,在此表中,提取过程中出现的“内含子”词汇和重复项已被删除——这是从 R2 到 R3 的独特词汇 Unique Lexicons 显著变化的原因之一。
视屏 : 4个主题与自然语言处理 、权重词语
- 异种移植 : 器官移植
- 索马鲁肽罕见副作用 : NAION与前提病灶
- 抑郁症 : 医师也会生病
- 红御科技的计算器 : 传统与精准估计病患率
视屏来源: 红御科技 Keras360.io
音乐🎵 : Alexandre Desplat 亚历山大·德斯普拉特
之前的挖掘轮次⛏️
请选取每个选项卡,以便进一步了解提取词汇的基本描述性统计信息。
第一轮 R1 :2024年5月4日
| Secondary Lexicons | Unique Lexicons | Non-neutral Lexicons |
Transplant Disease.severity Pain Adverse.event Dose.response Waiting.list Switch.regimen Vaccination AI Neurodegen GI Chemoimmuno Cost.benefit Cost.utility Ocular | 384,581 532,105 942,474 839,166 570,375 47,582 22,423 241,777 88,963 152,327 328,008 507,577 214,169 29,823 18,746 | 133,305 191,953 332,805 289,334 192,569 19,048 7,788 81,002 31,264 53,269 111,326 178,471 78,564 10,958 6,355 |
| Total | 4,920,096 | 1,718,011 |
第二轮 R2:2025年1月5日
| Secondary Lexicon | Unique | Non-Neutral |
|---|---|---|
| Round 1 + 2 | | |
| Transplant | Transplantation | 430,880 | 149,574 |
| Disease Severity | 538,681 | 194,410 |
| Pain | 1,091,408 | 385,810 |
| Adverse Event | 873,541 | 301,242 |
| Dose Response | 596,931 | 201,331 |
| Waiting List | 51,645 | 20,725 |
| Switch Regimen | 22,553 | 7,837 |
| Vaccination * (a) | 303,710 | 102,038 |
| AI * (a) | 133,910 | 47,383 |
| Neurodegenerative | 154,980 | 54,159 |
| Gastrointestinal | 380,397 | 129,614 |
| Chemotherapy | 584,032 | 205,813 |
| Cost Benefit | 237,418 | 87,217 |
| Cost Utility | 33,311 | 12,282 |
| Ocular | 35,361 | 11,928 |
| Round 2 | | |
| Renal Disease (a) | 672,112 | 232,691 |
| Nutrition | 728,251 | 254,012 |
| Obesity | Overweight | Binge | 400,990 | 141,851 |
| Reproductive* | 173,387 | 57,379 |
| STDs* | 287,635 | 99,324 |
| Family Planning | Contraceptives | 45,134 | 15,187 |
| Wounds | 387,061 | 134,465 |
| Precision Medicine | 164,889 | 63,449 |
| Statistics | Clinical Study Design | 553,781 | 195,988 |
| QoL | 1,069,522 | 400,279 |
| Reconstructive* | 105,142 | 36,867 |
| Personality Disorder* | 30,558 | 12,607 |
| Psychological Trauma | 64,571 | 26,331 |
| Disease Diagnosis | 1,831,181 | 629,965 |
| | | |
| Total (R1+ R2 group) | 5,468,758 | 1,911,363 |
| Total (R2 group) | 6,514,214 | 2,300,395 |
| Total (all groups) | 11,982,972 | 4,211,758 |
* 包含搜索词的独特字符串*
(a) 提取中至少包含一个损坏的文件;该问题已于2025年1月6日解决。
结果基于随机对照试验 (RCT) 和临床试验,唯一的例外是 Disease Diagnosis “疾病诊断”搜索标准。
其他相关内容:
