登录

主题


分类

识别

实验结果表明,在BERTopic模型中融合自主设计的化学分词器后,模型在主题识别性能上优于传统LDA模型,主题一致性指标提升超100%,主题多样性指标最高提升了126%。
文章

性能提升:与传统隐含狄利克雷分布(LDA)模型相比,本研究提出的主题提取模型在主题一致性上提升了100%-367%,在主题多样性上提升了0%-126%,提高了主题识别的准确性。
文章

设计了一种基于Punkt算法的分词器,解决了化学领域实体命名的分词难题,提升了主题识别的可解释性和鲁棒性。
文章

研究

主题研究方向得到了进一步发展
文章

基于过往主题的研究基础,主题3_020和3_048进一步研究了大规模纳米结构阵列基底上的拉曼增强效应。
文章

演变

引文分析结果不仅体现了拉曼光谱领域学术社区的分布特征,还表明学术社区的密度波动趋势与主题演变的结果相吻合。
文章

这些工作揭示了研究趋势演变的原因,为主题演变提供了重要支持。
文章

(d)用余弦相似性算法获取以桑基图形式展示的主题演变结果;
文章

为了研究主题演变与社区密度之间的内在关系,本工作分析了不同阶段社区密度的演变,并选择以化学社区作为案例进行分析。
文章

此外,研究团队通过分析拉曼光谱技术领域不同发展阶段的主题演变和学术社区密度变化,探讨了该领域研究的深化和扩展过程。
文章

结合图4中的核心路径与图2的主题演变结果,本文展示了拉曼光谱的发展过程。
文章

演化

此外,主题演化结果展示了拉曼光谱的主题分布和演化关系,突出了拉曼光谱研究的深化和扩展。
文章

III相邻阶段之间的主题演化
文章

基于完整的主题演化图(图S7),本工作将核心主题定义为具有三个及以上子主题或父主题主题,从而获得了拉曼光谱三个不同阶段的核心主题(图2a)。
文章

这些结果表明,主题演化关系的出现通常都伴随着主题词的继承。
文章

模型

(a)和(c)分别为BERTopic主题模型的输入和输出。
文章

(b)BERTopic主题模型的架构由五个独立的模块组成;
文章

(c)为了获得每个阶段的主题分布,使用主题模型从文本信息中提取主题
文章

如图1所示,框架的工作流程主要包括三个步骤:数据收集(图1a)、主题模型构建(图1b-d)和引文分析(图1e-f)。
文章

可解释性

其取值范围为[-1,1],当值越接近1时,主题的可解释性越高。
文章

这些结果表明,设计开发的分词器能够处理特定的领域命名规则以提高主题的可解释性。
文章

信息

其次,本研究基于BERTopic模型,从语料库中提取主题信息。
文章

在表示模块中,c-TF-IDF算法被用于从短语序列中识别主题术语并且提取主题信息(图1c)。
文章

之间

(a)具有至少两个子主题主题之间的演化关系以桑基图的形式显示,主题的标签由发展阶段编号和主题编号组成,以下划线分隔。
文章

(b)核心主题之间的相似性关系以关联热力图的形式展示,最小和最大相似度值分别为0.77和0.92;
文章

为了阐明不同研究阶段核心主题之间的相关性和演化趋势,文章以相关性热图的形式可视化了核心主题之间的相似度(图2a)。
文章

从图2可以发现,与Tn和Tn+1阶段的核心主题相比,Tn+1和Tn+2阶段的核心主题之间表现出更高的相似度。
文章

当值越接近1时,主题之间的差异越大。
文章

拉曼光谱领域不同阶段的主题分布以及主题之间的演化关系。
文章

随后,余弦相似度算法被用于确定主题之间的演化关系(图1d)。
文章