聊天机器人:如何构建信息架构(IA)来支持人工智能(AI)驱动的项目

Author Tanmer Lisa
Lisa · 2025-02-27发布 · 209 次浏览

人工智能、聊天机器人与分类法之间有着天然的联系。分类法是数据组织的基础,决定了信息如何被结构化、索引和访问。

随着技术的不断发展,我们正日益接近通过先进技术将人们与信息更紧密地连接在一起。聊天机器人和虚拟助理已成为消费者、员工和患者等获取知识的重要门户。最有效的聊天机器人不仅能通过机器学习和允许自然语言提问的直观界面提升用户体验,还能成为访问组织知识库的重要入口。

然而,这一切的前提是坚实的信息架构基础。

需要先进技术只是难题的一小部分。在 Baklib,我们收到很多人在部署这些类型的先进技术失败后给我们打电话,尽管他们拥有优秀的开发人员。缺乏信息战略(基础)是他们的阻碍。

本文我们将使用分类法、人工智能和聊天机器人作为框架,解释分类法和本体中信息策略的重要性,以使人工智能驱动的聊天机器人发挥最佳性能。

1.关于分类法,我们在其他地方也聊到了分类法相关内容:

分类法在内容发布工作流中的作用

从混乱到清晰:内容分类和信息架构最佳实践

2. 关于信息架构,这个我们聊得是比较多的

信息架构( IA )的信息理论-第1部分

信息架构(IA)的信息理论-第2部分

每个企业都应该了解的6个关于信息架构重要的事

基于信息架构的网站建设理论与实践-Baklib

基于IA信息架构的知识库理论和实践 - Baklib

人工智能、聊天机器人、分类法之间的关联

人工智能、聊天机器人与分类法之间有着天然的联系。分类法是数据组织的基础,决定了信息如何被结构化、索引和访问。

当信息按照分类法进行结构化和索引时,用户可以更轻松地通过层级深入到具体类别、向上查找更广泛的主题,或者横向探索相关主题。

对用户有利的事情也同样对 AI 有利。通过结构化数据,可以缩短 AI 项目价值实现的时间,并让企业更快地从技术投资中获得回报。

分类法和更复杂的本体(ontology)能支持和推动 AI 技术的应用。组织从人工智能驱动的聊天机器人中获得的好处,往往取决于所用数据的质量。数据越结构化、质量越高,AI 就能更好地理解和利用这些信息,提供准确的答案与建议。

反之,数据不完整、错误或有偏见时,AI 的表现将不尽如人意,甚至可能对品牌形象产生负面影响。因此,组织应着重于确保数据的高质量和一致性,以保证 AI 系统的成功运行。

分类法简史:Berrypicking 模型

1989 年,信息学家 Marcia Bates 提出了“Berrypicking”模型,指出了信息检索行为中的关键要素,尤其是如何应对动态变化的查询。这一模型成为了解决信息查找问题的重要基础。

在线搜索界面的浏览和BERRYPICKING技术设计。

Marcia J.版权所有©1989。贝茨

贝茨指出:

  1. 搜索查询通常是动态变化的,而非静态的。

  2. 用户往往会以零碎的方式收集信息,而非通过一组最佳检索信息。

  3. 用户会使用多种检索技术,跨越书目数据库以外的其他资源。

  4. 查询会随着用户对信息的理解不断变化。

这一思路为构建更智能、更灵活的人工智能搜索系统提供了重要启示。

实际应用:从 AI 驱动聊天机器人到智能信息架构(IA)

最近,Baklib 与众多开发人员和人工智能工程师合作,共同打造 AI 驱动的聊天机器人。尽管这类项目看似复杂,但我们的团队凭借成熟的信息架构方法,发现这一过程并不那么陌生。我们已经准备好重新评估并调整我们的方法,但对于方法的持久性和适应性感到惊讶。

我们的经验表明,尽管 AI 项目在技术实施上复杂,但理解用户需求、内容可用性、法律和安全问题等关键方面,对于聊天机器人系统的成功同样至关重要。

5 个关键要素:每个聊天机器人都应考虑的内容

在评估 AI 驱动的聊天机器人时,我们发现以下几个领域对于系统的设计至关重要:

  1. 同义词、同音词、反义词等:确保系统能够理解并处理语言的多样性。

  2. 查询消歧:例如区分“土耳其”动物与“土耳其”国家。

  3. 查询扩展/细化:例如,将“Terrier”拓展为“Dog”。

  4. 跨域关系识别:例如,从“狗”推导出“治疗辅助工具”。

  5. AI 训练与规则、实体提取:确保 AI 系统能根据规则提取相关信息。

通过这些要素的精确评估,能够帮助我们确定聊天机器人所需的资源和能力,确保信息架构支持的功能完整性。

需求收集

每个项目都应该做到需求收集并汇总后进行需求评估,下图是需求收集的类型与流程:

分类法构建输入

评估之后,我们转而关注聊天机器人需要什么样的资源。企业分类项目有许多组件,包括治理、维护、系统集成等。对于像聊天机器人这样以查询为中心的项目,可以使用许多来源,包括:

  • 从在线和文档内容中提取实体结果

  • 审查搜索日志

  • 支持团队记录的用户问题

  • 行业标准分类法和术语

  • 公开可用的支持文档

  • 用户研究

  • 本体工具培训和文档

获取分类法

聊天机器人有很多功能,但我们专注于那些可以通过分类/本体支持的功能。一旦我们将聊天机器人和本体功能列表并排放置,很明显聊天机器人功能在几乎所有可查找性项目中都很常见。认识到这一点有助于鼓励我们坚持基本原则。

聊天机器人的分类功能

  1. 同义词、同音词、反义词等。

  2. 查询消歧(即“土耳其”动物与“土耳其”国家)

  3. 查询扩展/细化(即“Terrier”→ Dog)

  4. 识别跨领域的关系(即狗→治疗辅助工具)

  5.  AI训练和规则、实体提取

Baklib 有幸极其聪明且以信息为中心的工程师团队合作,这使得人工智能组件不再那么令人畏惧。我们不需要非常努力地让人们相信不同类型的词条(同义词、反义词、昵称等)的价值。当开发人员努力寻找与动词交互的最佳方式时,我们可以为他们构建一个“动词”分类法。

在下面,您可以看到依赖本体的功能(黄色)在那里。

最终思考:将信息架构作为 AI 成功的关键

从宏观角度来看,糟糕的数据质量每年给美国行业带来的损失数以万亿美元计,给组织带来的损失也可达到数百万美元。差劲的信息架构和分类法实践不仅会拖慢数字化进程,还会让员工感到沮丧,并促使客户转向竞争对手。

因此,为了确保 AI 驱动的项目能够成功实施,企业需要:

  • 始终聚焦最终用户的目标:我们所构建的分类法和本体模型必须服务于用户需求,才能实现最大的商业价值。

  • 将智能搜索视为多功能工具:不仅仅是一个查询系统,而是一个多维度知识管理平台。

  • 投资强大的信息架构:优秀的信息架构设计可以确保系统具备高质量的数据支持,而不仅仅依赖 AI 技术本身。

通过信任信息架构的基本原则,并将这些原则与先进的 AI 技术结合,企业能够更好地解决信息检索中的问题,提升用户满意度,并确保品牌在未来技术环境中的竞争力。

标签:

AI IA 分类学
提交反馈

博客 博客

专注数字内容治理,助力数字体验升级

最全TOP 50 大模型 AI 知识库软件厂商排名汇总

最全TOP 50 大模型 AI 知识库软件厂商排名汇总

编者按:千行百业都在上大模型上 AI;同时我们也发现大模型+知识库是企业落地 AI 的最佳路径。所以我们通过汇总收集大模型+知识库的软件厂商,方便用户一窥究竟。内容持续更新中,排名不分先后~

Author top50
By Baklib
发布:2025-05-08
像图书管理员一样实施人工智能的4个技巧

像图书管理员一样实施人工智能的4个技巧

借鉴图书管理员的智慧,企业在引入人工智能时同样需要结构化思维、风险治理和人类监督。Baklib 作为AI驱动的一体化内容管理平台,帮助企业高效组织知识、优化元数据结构,并实现内容多场景应用与体验,智能搜索与推荐。

Author 4-tips-for-implementing-ai-like-a-librarian
By Lisa
发布:2025-05-07
什么是内容图谱?让知识和内容真正联动起来

什么是内容图谱?让知识和内容真正联动起来

本文深入解析了“内容图谱”的概念,强调其作为附带语义关系和结构化内容的知识图谱形式,如何提升信息检索、内容管理和个性化推荐体验。通过具体示例,如搜索“光学”时展示的知识卡,文章展示了内容图谱如何整合概念、内容、作者、元数据等信息节点,...

Author 0c78
By Lisa
发布:2025-05-06
战略型首席数据官(CDO):数据领导力的四大成功要素

战略型首席数据官(CDO):数据领导力的四大成功要素

Baklib 是专为AI Data Ready 新一代数字内容体验云,助力战略型CDO推动数据文化建设、加强跨部门协作、完善数据治理体系。通过统一的信息架构和灵活的内容分发机制,Baklib 打破数据孤岛,让企业更高效地释放数据价值,...

Author the-strategic-cdo-four-success-factors-for-data-leadership
By Lisa
发布:2025-04-18
信息掌控的五个阶段

信息掌控的五个阶段

信息已成为企业关键资产,管理成熟度却普遍不足。本文结合“五个信息成熟阶段”模型,探讨如何借助 Baklib 数字内容体验云平台统一知识入口、提升协同效率,助力企业实现信息治理跃升。

Author the-5-stages-of-mastering-your-information
By Lisa
发布:2025-04-18
超越标签:打造符合业务目标的分类体系

超越标签:打造符合业务目标的分类体系

分类体系的成功在于其业务价值,而非技术定义。本文探讨如何通过灵活的术语调整,使分类体系更易被企业接受,并推动全渠道优化。同时,Baklib 助力企业构建智能化知识体系,提升用户体验,实现数字化转型。

Author fe85
By Lisa
发布:2025-03-31
高效项目管理:7 大实用技巧与工具推荐

高效项目管理:7 大实用技巧与工具推荐

本文介绍了七个优化项目管理的关键技巧,包括明确项目范围、制定计划、有效沟通、监控进展、组建团队、合理规划和使用合适工具。文中推荐了 Baklib、Asana、Slack 等工具,帮助提升管理效率,增强团队协作,确保项目顺利推进并按时交付。

Author abf5
By Lisa
发布:2025-03-31