没事别随便提信息架构——读Web信息架构

入行也有一些时日了,曾经看到不少文档和设计稿里,有一部分是对“信息架构”的说明。这些说明其实一般也就是个网站的sitemap,甚至只是最粗略的导航和页面关系说明——这只是信息架构非常小的一个部分?到底什么是信息架构?

读完在“想读”list里蹲了好久的《Web信息架构》,感觉有点如释重负,仿佛自己久治不愈的拖延症稍微有了一点点起色。读电子版的一大好处就是感觉不到书的厚度,读着、读着、读着,突然就发现读完了。

言归正传,这是一本“严谨”又“热情”的书,严谨的部分很实在地介绍了信息架构的基本概念、方法、案例等;热情的部分简直是本书的bonus,作为一个新兴的、跨学科的、价值待证明的领域,作者用自己丰富的经验,用絮叨又幽默的语气,向我们述说着这个行当面临着哪些挑战,哪些组织的哪些层级的哪些人,会提出怎样的挑战和疑问,作为一名靠谱的信息架构师,应该以什么样的态度去面对和回答这些问题。——真的,没事别乱提信息架构。

一、信息架构是干什么的?

1.什么时候需要考虑信息架构?

信息正好处在数据和知识之间混乱的地带。

信息的结构化程度不如数据,可传递性(可描述性?)又好于知识,是我们在网络上查看、搜寻的最一般的类型。

当一个网站/系统需要帮助其使用者更好地从大量数据中获取信息时,就需要考虑信息架构。越是以信息查询、获取、消费、生产等作为核心业务的网站,信息架构越重要。例如,内容型网站(如资讯门户、企业内网)、电子商务网站、垂直类社交网站(如问答类)的信息架构,比工具型网站(如日程管理、邮箱)要重要得多。

2.信息架构由什么组成

网站的信息架构可以分为元素、关系和表达三部分。

  • 元素可以用建筑的砖块来类比。支撑一个建筑的基本构成单元是什么?有多少种?体量多大?什么材质?——基本的信息单元是什么,由谁产生,如何更新,有哪些自有的和附加的属性/元数据,它们如何描述信息,如果在信息存取过程中发挥作用;
  • 关系可以用建筑的骨架结构来类比。一个建筑的基本架构是怎样的?有哪些空间单元?它们各自的作用是什么?如何联通?——数据如何产生、如何分类、如何组织、如何流动、如何发生关系;
  • 表达可以用建筑的外观和环境标识来类比。人们看到建筑有什么感受?身处其中时有什么感受?如何在其中穿行,根据指示到达要去的地方?——使用者在哪里通过什么方式获得信息?界面对信息的描述、指示和引导是否充足有效?

3.信息架构要做的事情

  • 设计结构(Structuring)——决定网站信息“单元”的粒度(granularity),及信息单元的相对大小或粗糙程度。
  • 决定组织方式(Organizing)——将组件组合成有意义而且各有个特色的类别。
  • 制定标签(Labeling)——如何称呼这些类别,如何导航。

信息架构的目标在于合理组织网站需要承载的信息,让人们通过浏览、搜索、提问等方式找到想要的东西。

二、如何搭建和优化网站的信息架构?

实践信息架构设计模式的基础:用户,内容,情境。

  • 必须了解网站背后的商业目的,以及可供设计和实践的资源,想办法把信息架构和企业的目标、策略、文化结合起来。
  • 必须注意目前内容的质量和数量,以及一年后会如何改变。所有权(内容谁提供?所有权是否分散?是否有外部信息提供商授权的内容?),格式,结构(文件、内容组件、xml),元数据(有多少元数据用来描述内容和对象?手动还是自动加入标签?质量和一致性程度如何?是否有受控词表?用户是否可以自定义标签?),数量,动态性(成长率或周转率如何?明年会增加多少内容?内容多久会过时?)
  • 必须了解主要观众的信息需求和信息搜寻行为。

1.探索不用类型的使用者,有哪些信息需求,以及什么样的信息获取策略,现在的系统存在什么问题

四种常见的信息需求:

  • 已知条目搜索(known-item seeking)——正确的东西
  • 探索式搜索(exploratory seeking)——一些好东西: 在搜索和浏览过程中学习,并不期待得到“正确”答案
  • 无遗漏式研究(exhaustive research)——每样东西: 搜索某一主题的任何信息
  • 重新找到——再次需要

一些研究方法:

【背景研究】

  • 短期和长期目标是什么?
  • 商业计划是什么?政治因素如何?
  • 计划和预算?
  • 观众是谁?
  • 观众为什么要访问这个网站?为什么会常来?
  • 用户应该能做什么事情?
  • 内容怎么建立?怎么管理?谁来做?
  • 技术基础架构是什么?
  • 以前有什么行得通?什么行不通?

【涉众访谈 stakeholder interview】

【启发式评估 heuristic evaluation】

【内容分析 content analysisi】

目的是找出内容和元数据内的模式与关系,为内容做更好的结构、组织,以及访问途径。对每一种内容对象记录:

  • 结构化元数据:描述该对象的信息等级。有没有标题?内容有没有分节?用户想直接获取这些信息吗?
  • 描述性元数据:主题?用户?格式?…………
  • 管理性元数据:描述该对象和商业情境的关系。谁创建了这个对象?谁拥有?合适建立的?何时应该移除?

记住自己的问题:

  1. 这个对象是什么?
  2. 如何描述这个对象?
  3. 这个对象和其他对象有何差别?
  4. 怎样让人找到?

【内容映射 content mapping】
将现有的内容结构、组织和位置进行可视化表达,如

【标杆法 benchmarking】

  • 竞争式标杆法:与他人做横向比较
  • 前后式标杆法:与自己做时间上的纵向比较

【卡片分类 card sorting】

让我们了解用户的心智模型,他们在脑中默默编组、排序、为任务和内容制定名称的方式。

此外还有使用量统计,搜索日志分析,客服信息,问卷,情境式调查(contextual inquiry),焦点小组,访谈,用户测试等方法。

2.理清所有的数据类型、属性、来源、更新情况等自有属性,回答它们如何组织的问题

理解的源头就是分类——Hayden White

组织系统由组织体系组织结构组成。

A.组织体系定义内容条目之间共享的特性,而且会影响这些条目的逻辑分组方式。

(1).精确性组织体系:可以将信息分成定义明确、互斥的区域。常见的是按字母顺序、按年表、按地理位置排序。

(2).模糊性组织体系:依赖的是体系构建的质量,以及体系内个别条目摆放的位置。常见的类型:

  • 按主题。设计时需要定义好内容的范围,注意涵盖面的广度
  • 按任务。将内容和应用程序组织成流程、功能或工作的集合。最常见的是电商网站
  • 按用户。如果用户群可以界定的比较清楚,可以提供很好的个性化服务,但模糊性依然存在,对系统“猜测”的要求很高
  • 按隐喻。多用于游戏
  • 混用

B.组织结构定义内容条目和群组之间的关系类型。

(1).等级式:自上而下的分类,类别互斥(在排他性和包容性之间取得平衡),平衡宽度(每一层选项数量)和深度(层级数);

(2).数据库模式:自下而上的做法,使用受控词表的元数据为文件和其他信息对象打上标签,就可以进行有力的搜索、浏览、过滤以及动态链接。ERD(entity relationship diagram)是在设计和采用数据库之前,建立与调整数据模型的方法。大型网站最好依赖CMS来管理元数据和受控词表。

(3).超文本:涉及两种主要组件:要彼此链接的条目或信息块,以及块状信息之间的链接。缺点是难以看清全貌,用户无法在网站组织上建立心智模型,所以通常不作为主要的组织结构。

 

设计标签

通用原则:尽量窄化范围,开发一致的标签系统而非标签。
为什么一致性很重要?因为一致性代表的就是可预测性,当系统可预测时,就容易学习

影响一致性的因素:风格,版面形式(字体、字号、颜色、空白、分组方式等),语法(动宾?问句?),粒度,理解性(没有重要的遗漏),用户(如果有必要,为每一类用户开发独立的标签系统)

创建新的标签系统

  • 从已有内容中抽取(慢,费力)
  • 要求内容作者为内容建议标签
  • 找用户代言人或主题专家(SME)
  • 直接来自用户(如卡片分类,对小群标签如导航比较适用,自由列表)
  • 间接来自用户(如query日志分析、标签分析)

 

3.要满足使用者的需求,数据应该如何被提取,如何呈现

信息架构为内容提供了情境:

  • 告诉我们现在在哪里;
  • 协助我们移动到其他关系紧密的网页;
  • 协助我们以层级方式(结构和目录)和情境方式(相关内容和功能)在网站内移动;
  • 让我们可以操控内容以便浏览(如筛选和排序);
  • 让我们知道可以去哪里找到基本服务(如登录和帮助)。

提供浏览信息的帮助:

  • 组织系统:网站内容分类或分组的主要方式(如按主题/任务/用户/年代),也称分类法和等级体系;
  • 全站导航系统
  • 区域导航系统
  • 网站地图/目录
  • 网站索引:排序后的链接列表
  • 网站指南:针对特定主题提供特定信息,以及连向网站中相关子主题的链接
  • 网站向导:可以通过一系列的步骤来引导用户,也有连向网站中相关子主题的链接
  • 情境式导航系统:用链接同意连向相关内容,通常内嵌在文字内,一般用来连接网站中高度专业化的内容,

提供搜索信息的帮助:

  • 搜索界面
  • 查询语言:搜索查询的语法;
  • 查询构造器:一些提升查询效果的方式,场景包括拼写检查器(qc?),词干分析、概念搜索(?),以及从词典取出同义词;
  • 搜索算法:决定哪些内容可以满足用户的查询;
  • 搜索区域:网站内容子集,经过特殊的索引设计以满足较细致的搜索;
  • 搜索结果:如何分类、分级、排序、聚类,显示多少结果。

隐藏的组件

  • 受控词表和叙词表:预先确定描述特定领域的较佳词汇。通常包含上位类、下位类、相关关系的叙词链接和优选词的说明。搜索系统可以从受控词表中取出查询的同义词以提升查询效果。
  • 搜索算法
  • 最佳猜测(best bets):匹配较佳的搜索结果,编辑和主题专家会决定哪些查询应该取出最佳猜测(直达区~~)

高级导航方法

  • 个性化和定制化:个性化是我们猜测用户想要什么(but 过去的绩效无法保证未来的成效);定制化是用户告诉我们他想要什么(but “don’t make me think”)
  • 可视化
  • 社会化导航:协同过滤、推荐引擎

三、信息架构的挑战和机会在哪里?

1.价值待证明

2.跨学科、多领域

3.对象的不可控性:信息模糊性(语言的天然属性),异质性(组成元素之间的差异,难以结构化),不同观点的差异性(必需摆脱自己心中为内容命名和组织的模式),

4.需要深入企业和组织,在复杂的内部政治环境中减少混乱和不确定性,寻求合理的解决办法。

 

by 00



00的公众号,更多分享酝酿中……

kidult00 wechat
扫码关注 00 的公众号
如果文章帮您节省时间或者解答疑问,不妨打个赏 :)