TEI笔记:人物、机构、地点相关信息的标识

TEI有一个通用名称元素<name>,适用于各种名称,可用属性@type定义名称类型,包括:人物、地点、机构、产品等。也可以使用专指元素表达,如<persName>人名, <placeName>地名, <orgName>机构名。
除了名称作为基本标识,人物<person>、机构<org>、地点<place>还有其他标识,TEI P5指南的第13章(Names, Dates, People, and Places尤其是13.3 Biographical and Prosopographical Data)有详细说明。
TEI将个人、机构和地点的信息归纳为三类,有各自的通用元素,即:<trait>特征(独立于个人意志的),<state>状态(与时间有关的),<event>、<listEvent>事件(改变状态甚至特征),可以用@type说明信息的具体类型,也可以使用如下专指元素。另外还有<relation>、<listRelation>说明相互间关系。
一、个人元素(13.3.2)
<person>,属性:@role职能/分类,@sex性别,@age年龄组(也可以用相应的专用元素)
<personGrp>
<listPerson>可用于TEI标头<profileDesc>之<particDesc>(参与者描述,如定义个人类别),也可用于正文
1、可嵌套的个人特征元素
<faith>信仰,<langKnowledge>语言知识,<nationality>国籍,<sex>性别,<age>年龄,<socecStatus>社会经济状态,<persName>人名(嵌套<forename>名、<surname>九),<occupation>职业,<residence>居所,<affiliation>单位,<education>教育经历,<floruit>活跃时期,<persona>角色,(没有专指元素时使用)<state>状态、<trait>特征
例(p.461)阿尔马尼亚族人
<trait type=”ethnicity” key=”alb”>【@type可以使用词表(种族),@key可以定义中国少数民族】
 <label>Ethnicity</label>
 <desc>Ethnic Albanian.</desc>
</trait>
2、可嵌套的个人事件元素
<birth>出生,<death>去世。其他用<event>@type定义。
例(p.462)结婚于1859年4月26日
<event type=”marriage” when=”1859-04-26″>
  <label>Marriage</label>
  <desc>
    <name type=”person” ref=”#WM”>William Morris</name> and <name type=”person”
ref=”http://en.wikipedia.org/wiki/Jane_Burden”>Jane Burden</name> were
married at <name type=”place”>St Michael’s Church, Ship Street, Oxford</name>
on
    <date when=”1859-04-26″>26 April 1859</date>.
……</desc>
</event>
3、人际关系元素
<relation><listRelation>,用@name说明关系类型。
例(p.464-465)
<relation name=”spouse” mutual=”#WM #JBM”/>【双向关系】
<relation name=”parent” active=”#RB” passive=”#JBM”/>【亲子关系:@active父母,@passive子女】
二、机构元素(13.3.3)
没有太多专指元素:<org>、<listOrg>机构,可嵌套的元素<orgName>机构名,<desc>描述。
三、地点元素(13.3.4)
<place>、<listPlace>地点,<placeName>地名
1、可嵌套的地理位置元素
(1)地理特征
<geo>地理坐标,<geoDecl>地理坐标声明,<geogFeat>地理地形特征(山、谷……),<geogName>地理名称(与地形名称结合的地名,如庐山)
(2)<location>位置
(从大到小)<bloc>多国(洲、欧盟……),<country>国家,<region>地区,<settlement>定居点,<district>区,<address>详细地址,<street>街;<locale>非正式描述地点性质
(3)<offset>相对位置
例(p.456)距巴黎北部20公里
<measure>20 km</measure>
<offset>north of</offset>
<settlement type=”city”>Paris</settlement>
2、可嵌套的地点特征与事件
<population>人口,<climate>气候,<terrain>地形。
没有专指元素时,使用<event>的@type说明特定事件。
例(p.474)治理变化:爱尔兰于1944年6月17日独立
<event type=”governance” when=”1944-06-17″>
<desc>Iceland became independent on 17 June 1944.</desc>
</event>
3、地点间关系
没有专指元素,通过<listPlace>或<place>层级嵌套表示。包括多地点(13.3.4.2),如多级行政区域、群岛,不同时期、不同语言名称;上下级关系等(13.3.4.4)等。(举例略)
详见最新版P5的指导文件:
参见:

TEI笔记:数字化文本的文字转录

TEI(Text Encoding Initiative,文本编码倡议)用于编码数字形式的文本全文,包括转录语音。语音转录方面,除口述文字外,TEI可以精准标记整个语音过程、包括非文本信息。
同样对于文本,除最终文字外,TEI也能标记整个书写过程、记录文稿上的各种修改、加注等痕迹,因而特别适合标识手稿、古籍、批注本等,以及对其数字化图片(数字摹本)的文字转录。TEI可以完美保留第一手资料信息,包括:不同位置的加注,手稿上的更改、更正、错误,书写过程中划线、加符号、重描(字上改写)、掉换顺序等修改痕迹,因损坏、模糊而无法转录情况,不同的笔迹等。当然,页眉、页脚、版式等信息也不会被忽略。
数字化文本的文字转录,古籍有很大需求,会涉及字符集不够大,需要说明竖排版式的问题。最新版P5的指导文件第5章对字符、字形和书写模式有说明(5 Characters, Glyphs, and Writing Modes)。而第11章则详解第一手资料的表示(11 Representation of Primary Sources),特别适用于数字化图片与转录文字对照表示的情况。
零、自造字与竖排本
1、字符:声明字符集中没有字符,以图片形式提供
在标头的<encodingDesc>,用元素<charDecl>声明字符
2、字形:声明已有字符的不同字形(比如避讳字?)
同上,用元素<charDecl>声明,增加新字符
3、书写模式:除从左向右、从上向下的通常书写外的各种其他模式
中文古籍多用从右向左的垂直书写模式,用属性@style说明。以下为日语例(p.203)
<lg xml:lang=”ja”
style=”writing-mode: vertical-rl”>
<l>古池や</l>
<l>蛙</l>
……
</lg>
一、数字摹本的表示
1、第1层元素
摹本<facsimile>、来源文档<sourceDoc>,可以代替或和<text>同用:
<text>转录文本
<facsimile>摹本图片
<sourceDoc>摹本图片+转录文本(嵌入转录法)
<facsimile>+<text>(并列转录法)
2、第2层及以下元素、属性
面<surfaceGrp>、<surface>(二维坐标空间,通常为1个数字化文件)
区域<zone>(面中的二维区域,如:叶中的页,页中的图区域)
坐标值属性:@ulx、@uly左上角x、y,@lrx、@lry右下角x、y
3、例(p.364):面组
<facsimile>
  <surfaceGrp n=”leaf1″>【面组/第1叶,含2页】
    <surface>
      <graphic url=”page1.png”/>
    </surface>
    <surface>【1面/第2页,有不同精度图片】
      <graphic url=”page2-highRes.png”/>
      <graphic url=”page2-lowRes.png”/>
    </surface>
  </surfaceGrp>
</facsimile>
4、例(p.365):面坐标
<facsimile>
  <surface ulx=”0″ uly=”0″ lrx=”500″ lry=”321″>
Handschrift.karlsruhe.blb.jpg”/>
  </surface>
</facsimile>
二、转录与摹本结合(数字化图片与文字对照)
例(p.371):并列转录法
<facsimile>【摹本图片】
  <surface start=”#PB49R”>【以PB49R为标识关联】
    <graphic url=”Bovelles-49r.png”/>
  </surface>
</facsimile>
<text>【转录文字】
  <body>
    <div>
      <!– … –>
      <pb xml:id=”PB49R”/>
      <fw>De Geometrie 49</fw>
      <!– … –>
    </div>
  </body>
</text>
三、转录文字方法
1、更改、更正和错误的文本(手稿常见现象)
选择<choice>(同一文本的交替编码组,嵌套<abbr><expan>、<sic><corr>等)
缩写<abbr>,扩展<expan>
更正<corr>,原文如此<sic>
添加<add>、<addSpan>,删除<del>、<delSpan>,恢复<restore>(嵌套<del>)
替代<subst>、<substJoin>(删除……改为……:嵌套<del><add>)
跳过<gap>(忽略),隔开文字<secl>,空格<space>
多余文字<surplus>,(转录者/编者)补充文字<supplied>
(1)例(p.384):在原有文字上标注删除
For I hate this <del rend=”strikethrough” hand=”#dhl”>my</del> body, which is so dear
to me …【在my上划删除线,表示删除】
<handNote xml:id=”dhl”>D H Lawrence holograph</handNote>【说明笔迹情况】
(2)例(p.385有手写稿图片):添加和删除
The O.E.D. is not a dictionary so much as a corpus of precedents <del hand=”#RG”>in the</del>:【未说明删除方式】
current, obsolete, <add hand=”#RG” place=”above”>cant,</add> cataphretic and
nonce-words are all included.【在行上添加文字】
(3)例(p.385):添加内容后被删除
You quote the <del>
<add hand=”#RG” place=”margin”>Norton</add>【页边添加文字】
</del> O.E.D…
(4)例(p.391, 392) :不同转录方法:跳过,或者添加
I am dr Sr yr <gap reason=”illegible” quantity=”3″
unit=”word”/>Sydney Smith【因难以辨认,跳过3个词】
I am dr Sr yr <supplied reason=”illegible” resp=”#msm”
source=”#Ry2″>very humble Servt</supplied> Sydney Smith【难以辨认,由责任人msm依据来源Ry2,添加3个词】
2、不同笔迹
笔迹说明<handNote>,笔迹改变<handShift>
3、损坏和猜测
损坏<damageSpan><damage>,模糊<unclear>
补充文字<supplied>,跳过<gap>
4、标记书写过程(文稿上的各种修改痕迹)
修改<mod>(如划线等)
元标记<metamark>(图形或文字符号,与各种修改结合用)
重描<retrace>(在原字上修改)
重做<redo>,撤销<undo>(如删除后恢复)
掉换顺序<listTranspose><transpose>(与<metamark>结合)
四、版式
例(p.411):定义面
<sourceDoc>
  <surfaceGrp type=”quire” n=”1″>【第1帖】
    <surfaceGrp type=”leaf” n=”1″>【第1叶】
      <surface type=”recto” n=”1r”>【第1页正面】
        <!– … –>
      </surface>
      <surface type=”verso” n=”1v”>【第1页反面】
        <!– … –>
      </surface>
    </surfaceGrp>
  <surfaceGrp type=”leaf” n=”2″>
    <surface type=”recto” n=”2r”>
      <!– … –>
    </surface>
    <surface type=”verso” n=”2v”>
      <!– … –>
    </surface>
  </surfaceGrp>
    <!– other leaves in first quire –>
  </surfaceGrp>
    <!– other quires here –>
</sourceDoc>
五、页眉、页脚等信息
印版工作<fw>(逐页标题、导词、页码等)
<fw type=”head” place=”top-centre”>Poëms.</fw>
<fw type=”pageNum” place=”top-right”>29</fw>
<fw type=”sig” place=”bot-centre”>E3</fw>
<fw type=”catch” place=”bot-right”>TEMPLE</fw>
六、在标头中定义变更和修订的标识(xml:id)
1、TEI标头<profileDesc>之<creation>,记录原文档制作或电子文件修订过程中的变化:
变化<listChange><change>
2、例(p.415)
<profileDesc>
  <creation>
    <listChange ordered=”true”>
      <change xml:id=”ST-1″>First stage, written in ink </change>【第1阶段,墨水笔书写】
      <change xml:id=”ST-2″>Second stage, with revisions written in the author’s hand
using pencil</change>【第2阶段,作者笔迹用铅笔修改】
      <change xml:id=”ST-3″>Fixation of the pencilled revisions together with further
revisions in the author’s hand using ink</change>【修改铅笔修订,作者笔迹用墨水笔修改】
      <change xml:id=”ST-4″>Additions in a different hand, probably at a later
stage</change>【可能在稍后阶段,以不同笔迹添加】
    </listChange>
  </creation>
</profileDesc>
详见最新版P5的指导文件:
参见:

国际图联2018年会推出的重要文件及网站

国际图联2018年会正在马来西亚吉隆坡召开(2018.8.24-30),会议期间发布或再推出一系列文件(有些有中文版)和网站,依新闻发布顺序:

1、IFLA Statement on Fake News(国际图联应对假新闻声明)
新闻报道:Build Skills, Fight Censorship: IFLA’s Response to Fake News (2018-8-25)
中文版新闻:增强各项技能,对抗审查制度:国际图联应对假新闻的对策
“网络虚假信息不仅影响个人决策而且危害社会舆论。然而与此同时,打击“假新闻”的概念又为限制言论自由的高压政策提供了借口。对此,行之有效的对策必须建立在更健全的媒体、信息素养以及对数字环境更强大自信的基础上,同时还要注意不要采取可能限制信息获取自由的措施。在这方面,图书馆大有可为。”
大有可为之处,就是提高信息素养,IFLA先前的相关文件:
2011:IFLA Media and Information Literacy Recommendations(中文版:国际图联媒介和信息素养建议书)
2017:IFLA Statement on Digital Literacy (18 August 2017)(国际图联数字素养声明)

2、Library Map of the World (LMW)(世界图书馆地图,网站)
新闻报道:Now available: Data, Stories and more with Country Pages from the IFLA Library Map of the World (2018-8-26)
中文版新闻:数据、报道及更多内容现已在国际图联世界图书馆地图国家页上推出
网站2017年IFLA年会发布。目前收录220万个图书馆(中国5909个,其中国家图书馆1、高校图书馆2914、公共图书馆2994)。
2018年新增栏目国家页(Countries),“包含对图书馆环境的简要概述,其中包括:图书馆系统、管理与资金模式、发展与政策优先事项以及图书馆界最新成果。此外,国家页将提供有关国家图书馆协会、国家图书馆、决策机构和图书馆支持组织的详情,以及有关图书馆政策与立法、教育与活动的信息”。
报道栏目(SD Stories)收录图书馆与联合国2030可持续发展目标(SDG)相关的“故事”,目前仅4个国家5个报道(为收集更多故事,IFLA另有指导讲故事的手册,见下6)。

3-4、IFLA Globe Vision(国际图联全球愿景报告) 和 IFLA Global Vision Ideas Store(国际图联全球愿意点子商店,网站)
新闻报道:Launched! IFLA Global Vision Ideas Store now live (2018-8-26)
新闻中文版:正式发布!国际图联全球愿景“点子商店”现已上线
IFLA Globe Vision:《全球愿景》目前只看到摘要(就是全文?):十大亮点和十大机遇中文版
国际图联全球愿意点子商店(网站):参与全球大讨论,截止期2018-9-30

5、Getting Started with the Marrakesh Treaty – a Guide for Librarians(《马拉喀什条约》入门:图书馆员指南)
新闻报道:Getting Started: New IFLA Guide on Making the Marrakesh Treaty Real (2018-8-27)
《马拉喀什条约》是针对视障者版权例外的国际条约,于2016年9月生效。中国于2013年6月28日最早一批签约,但一直没有批准(WIPO-Administered Treaties: Contracting Parties > Marrakesh VIP Treaty,80个签约国,未批准的一半以上)。因此中文版新闻也没有了?

6、Libraries and the Sustainable Development Goals: A Storytelling Manual(图书馆和可持续发展目标:讲故事手册)
新闻报道:Tell your story! 2019 offers a crucial opportunity for library advocacy (2018-8-27)
中文版新闻:讲述你的故事!2019年为图书馆宣传提供重要机遇
在前述世界图书馆地图(LMW)中,提交图书馆的故事,重点关注联合国2030年议程及其17个可持续发展目标(SDG),特别是2019年的高级别政治论坛将重点关注的教育、就业、平等和信息获取方面的内容。目的是向国家和国际领导人展示图书馆贡献的重要性,并有助于使图书馆赢得应有的认可。

7、IFLA Statement On Copyright Education and Copyright Literacy(中文版:国际图联关于版权教育和版权素养的声明
新闻报道:Accelerating Access: IFLA Releases Statement on Copyright Literacy (2018-8-27)
中文版新闻:加速访问: 国际图联发布关于版权素养的声明

8、IFLA’s Trend Report 2018 Update(国际图联趋势报告2018年更新版)
新闻报道:Facing the Future with Confidence: IFLA’s Trend Report Update 2018 (2018-8-28)
中文版新闻:满怀自信,面对未来:国际图联趋势报告2018年更新版
着重说明“不要预测,做好准备”【有点矛盾?】

9、Development and Access to Information (DA2I)(发展和信息获取)
新闻报道:Seizing Opportunities, Delivering Development: IFLA and the UN 2030 Agenda (2018-8-28)
中文版新闻:【抓住机遇,实现发展:国际图联和联合国2030年议程
本报告2017年发布。目的详见6“讲故事”。

国际图联2018年会,参见建中博客会议现场报道:
国际图联吉隆坡年会(一) (2018-08-25 09:46)
国际图联吉隆坡年会(二)图书馆不仅要服务社会,而且要影响社会 (2018-08-25 22:08)
国际图联吉隆坡年会(三)全球愿景报告发布 (2018-08-26 08:33)
国际图联吉隆坡年会(四) (2018-08-27 15:04)
国际图联吉隆坡年会(五)school7获得2018年度公共图书馆奖 (2018-08-28 12:45)