August 2007


《精通正则表达式(第3版)》(即Mastering Regular Expression,3rd Edition)是一本好书。
我还记得,自己刚开始工作时,就遇到了关于正则表达式的问题(从此被逼上梁山):若从文本中抽取E-mail地址,还可以用字符串来查找(先定位到@,然后向两端查找),若要抽取URL,简单的文本查找就无能为力了。正当我一筹莫展之时,项目经理说:“可以用正则表达式,去网上找找资料吧。”抱着这根救命稻草,我搜索了之前只是听说过名字的正则表达式的资料,并打印了java.util.regex(开发用的Java)的文档来看。摸索了半天,我的感觉就是,这玩意儿,真神奇,真复杂,真好用。
此后,用到正则表达式的地方越来越多,我也越来越感觉到它的重要,然而使用起来却总感觉捉襟见肘。当时是夏天,北京非常热,我决定下班之后不再着急赶车回家,而是在公司安心看看技术文档,于是邂逅了这本Mastering Regular Expression。该书原文是相当通畅易懂的,看完全书大概花了我一周的业余时间,之后便如拨云见日,感觉别有洞天——原来正则表达式可以这样用,真是奇妙,真是令人拍案叫绝。
此后我运用正则表达式便不用再看什么资料了,充其量就是查查语言的具体文档,表达式的基本模型和思路,完全是在阅读本书时确立的。也正是因为细心阅读过本书,所以有时我能以正则表达式解决某些复杂的问题。我的朋友郝培强(Tinyfool,昵称Tiny)曾问过我这样一个正则表达式的问题:在Apache服务器的Rewrite规则中,要求以一个正则表达式匹配“除两个特定子域名之外的所有其他子域名”,其他人的办法都无法满足要求:要么只能匹配这两个特定的子域名,要么必须依赖程序分支才能进行判断。其实这个问题,是可以用一个正则表达式匹配的。事后,Tiny说,看来,会用正则的人很多,但真正懂得正则的人很少。现实情况也确实如此,就我所见,不少同仁对正则表达式的运用,不外乎从网上找一些现成的表达式,套用在自己的程序中,但对到底该用几个反斜线转义,转义是在字符串级别还是表达式级别进行的,捕获型括号是否必须,表达式的效率如何,等等问题,往往都是一知半解,甚至毫无概念,在Tiny的问题面前,更是束手无策,一筹莫展。
就我个人来说,我所掌握的正则表达式的知识,绝大多数来自本书。正是依靠这些知识,我几乎能以正则表达式进行自己期望的任何文本处理,所以我相信,能够耐心读完这本书的读者,一定能深入正则表达式的世界,若再加以练习和思考,就能熟练地依靠它解决各种复杂的问题(其中就包括类似Tiny的问题)了。
去年,通过霍炬(Virushuo)的介绍,我参加了博文视点的试译活动,很幸运地获得了翻译本书的机会。有机会与大家分享这样一本好书,我深感荣幸。500多页的书,拖拖拉拉,也花了半年多的时间。虽然之前读过原著,积累了一些运用正则表达式的经验,也翻译过数十万字的资料,但要尽可能准确、贴切地传达原文的阅读感觉,我仍感颇费心力。部分译文在确认理解原文的基础上,要以符合中文习惯的方式加以表述仍然颇费周折(例如,直译的“正则表达式确实容许出现这种错误”,原文的意思是“这样的错误超出了正则表达式的能力”,最后修改为“出现这样的错误,不能怪正则表达式”或“这样的问题,错不在正则表达式”)。另有部分词语,虽可译为中文,但为保证阅读的流畅,没有翻译(例如,“它包含特殊和一般两个部分,特殊部分之所以是特殊的,原因在于……”,此处special和normal是专指,故翻译为“它包含special和normal两个部分,special部分之所以得名,原因在于……”),这样的处理,相信不会影响读者的理解。
在本书翻译结束之际,我首先要感谢霍炬,他的引荐让我获得了翻译这本书的机会;还要感谢博文视点的周筠老师,她谨慎严格的工作态度,时刻提醒我不能马虎对待这本经典之作;还有本书的责编晓菲,她为本书的编辑和校对做了大量细致而深入的工作。
另外我还要感谢东北师范大学文学院的王确老师,在我求学期间,王老师给予我诸多指点,离校时间愈长,愈是怀念和庆幸那段经历,可以说,没有与他的相识,便没有我的今天。
本书是讲授正则表达式的经典之作,翻译过程中,我虽力求把握原文,语言通畅,但翻译中的错误或许是在所难免的,对此本人愿负全部责任。希望广大读者发现错误能及时与我和出版社联系以便再版时修正,或是以勘误的形式公布出来以惠及其他读者。如果读者有任何想法或建议,欢迎给我写信,我的邮件地址是:yusheng.regex@gmail.com。

(more…)

要找一本书,遍寻不着,打电话到各家书店,都已经售完。

情急之下,才想到图书馆可能有,去国图的网站一查,果然是。便在突突地想念,周末要去国图办卡,反正中级职称也有了,借书不受限制。

翻出以前泡图书馆的照片,那时候,我是多么迷恋开架阅览室啊,那么多好书,只有想不到,没有找不到。到如今,才短短几年,怎么图书馆,竟然成了模糊的记忆了呢。

library.jpg

所谓翻译,指的是将原语(source language)转换为译语(target language)的过程,其实质可理解为,以译文表达原文的含义和情态。

按照美国语言学家诺姆·乔姆斯基(Noam Chomsky,顺便说一嘴,此人也是“说话不负责任”的知名左派)提出的“转换生成语法(Transformational-Generative Grammar)” ,句子的意思必须通过句法来组织和表达,而句法分为两个层面:一个层面是“表层结构(Surface Structure)”,即句子的外部形式;另一个层面为“深层结构(Deep Structure)”,即句子的内部形式。后者是人类在说话之前,头脑中的连贯意念,是抽象的,无法直接感知的,只有通过表层结构将其转换为外部形式,才能进行沟通和交流。

这样看来,从原语到译语的转换,细分起来,必须经过两重转换:从原语的表层结构重新构建出深层结构,再以译语的表层结构将其表达出来。因此我们可以说,译文与原文的对应关系,重在深层而不在表层。

然而事情又不单单是这么简单,语言决定论认为,语言本身会影响思维,这种观点确有合理之处,所以我们未必能从原语的表层结构无困难地构建出译语的深层结构;同时,深层结构也不能完全脱离表层结构独立存在,譬如诗歌就是这方面的典型——诗歌的文字是用来表达的感情和意象的,而这些文字本身也构成了审美对象,此时,深层结构和表层结构交织重叠在一起,翻译的难度就大大增加。

了解了以上这些,我们便可以归纳出语言转换的四种模式:

  1. 契合式:概念(深层结构)对应,表达形式(表层结构)大体对应;
  2. 并行式:概念(深层结构)并行,表达形式(表层结构)大体并行;
  3. 冲突式:概念(深层结构)相左,表达形式(表层结构)不同;
  4. 替代式:概念(深层结构)替代,表达形式(表层结构)替代;

契合式是最常见也最容易的,更何况,不同的语言有时会有惊人的一致性,例如“heart-breaking”对应“心碎”,“eye-popping”对应“令人瞠目的”,“We love peace”对应“我们爱和平”。

并行式也是较为常见的情况,且多见于俗语、谚语,两种语言的表现形式不同,但意思是对应的,譬如“寄人篱下”对应“live under somebody’s roof”,“雨后春笋”对应“spring like mushrooms”。

冲突式主要出现在一词多义,或者语境变化的场合。譬如汉语中的“五四运动”和“热爱运动”,“运动”都做名词,但所指不同,翻译时不能统一处理;而英语中的“No pay, no gain”和“No smoking”,“No”的含义有很大差别,翻译时也应当细心辨别。

替代式主要出现在译语缺乏原语的对应概念(counterpart)的情况下。譬如英语中的footwears,泛指脚上穿的鞋、袜等,在汉语中没有对应的概念;而汉语中的“穴位”,在英语中也没有对应的概念。此时或者需要根据具体的情况加以辨别,找到相近的概念,譬如明确某处提到的footwears是“鞋”还是“袜”,或者可以以详细阐释的方式解决(实际上我认为,某些此类差异,如果深究起来,应当是由不同的世界观所造成的,具体可参见恩斯特·卡西尔的《人论》)。

明白了这一点,我们就能知道,在翻译时,“贴切原文”的译文,并非就是好的译文。译者应当根据具体的情况,灵活选择合适的语言转换模式,加以处理。我在翻译《精通正则表达式》时,曾经被“character class”的翻译困扰了很久,此处的“class”,与“base class”中的“class”虽然相同,但意义不同,故不宜翻译为“字符类”。最终参考Merriam-Webster的解释,最贴切的应当是这个意思——“a collection of adjacent and discrete or continuous values”,最终翻译为“字符组”,表示“一组(系列)字符”,方才满意,这也是冲突式转换的一个实例。

参考阅读:刘宓庆《文体与翻译》

用同事的机器拍的,今天才找到

狗尾草

grass1.jpg

花骨朵

grass2.jpg

赶上限时抢购活动,没多想,把觊觎已久的惠威M200 Mk2买了回来,以前的创新Soundworks SW300转移阵地到公司,家里鸟枪换炮。

买了一个多礼拜,可惜煲的时间不太多,很多歌还是放不开,不过声场的感觉明显好多了,而且高音确实非常棒,反复听《红星十年纪念专辑》里田震的《干杯,朋友》,真正知道什么叫“声线”了。

有人说,M200 Mk2是“讨巧”的声音,为了讨好听者,加入了修润,不若监听音箱那样冷静而精确。讨好就讨好吧,我更喜欢让自己的耳朵舒服一些。

现在的问题是,忽然发现以前收藏的很多MP3,包括一些从已经成为纪念的短歌行网站下载的,细节和层次感不如少数几首精品mp3,也比不上制作精良的正版CD。本来买对音箱是为了听音乐,现在反客为主,得找些高质量的歌来搭配音箱了……

官方的宣传画是这样

m200mk2.jpg

我自己的摆设是这样

hivi.jpg

偶然遇见电视台放《阿甘正传》,重看了一次,感觉大不一样。

上一次看,还是“大片”刚刚进入中国时,作为一个小初中生,跟父母去电影院看的,当时印象深刻的,就是他给总统看屁股上的疤,和电脑做出来的历史镜头——电脑真神奇。

这次看,却发现每个小故事都设计很巧妙,都在讲道理,而绝不是简单地“傻人有傻福”。

印象比较深刻几个片段:

阿甘和丹中尉在捕虾船上,一无所获,丹中尉抱怨说,“上帝他妈的在哪呢”。于是,上帝马上就现身了——风云突变,雷电交加。最终,他们得以安然无恙,阿甘说:“丹中尉还是和以前一样,不过,我想,他再也不抱怨上帝了。”

阿甘接到母亲病危的消息,一路飞奔回家,打开门,医生从她母亲身边起来,欠欠身说“我明天再来”。
阿甘问“妈妈,你怎么了?”
“亲爱的孩子,我要死了,死是生命必须要经历的阶段。”
说这番话的时候,她脸上满生平和、慈祥的表情,身后的窗外,是大片的草地,和绿意盎然的大树。

阿甘在东西海岸之间来回跑,身边围着大批的记者。
“请问,你这么跑的意义是什么?”
“请问,你是为了妇女儿童权益吗?”
“请问,你是为了宣传环境保护运动吗?”
阿甘说,我只是觉得自己要跑步,就去做了,就是这样简单。

现实中,我们把这种简单叫做傻,把瞻前顾后的复杂叫做有目的。
问题是,凡事都得有个目的吗?

偶然看到这篇文章,算起来,还是我翻译的第一篇论文,时间大概是2003年夏。

现在有了自己的空间,存起来做个纪念吧。

哈耶克与波普:谁影响了谁?

Bruce Caldwell

大约20年之前,我开始研究下面这个问题,并试图用一篇论文概括我的结论,即博学的科学哲学家卡尔·波普和博学的社会理论学家弗里德里希·奥古斯特·哈耶克之间,究竟谁对谁的影响更大?

人们不难理解,年轻的学者想要进行这种尝试的原因:这两人是他们各自领域的巨匠,都对社会科学的方法论——也是我那时的研究领域——有所贡献。很值得一提的是,他们都不同程度的提到对方是自己的智识发展过程中的重要人物。举例来说,在波普那封被广泛引用的给哈耶克的信中,他是这样开头的:“我想,我从你那里学到的,比从其他任何在世的思想家那里学到的都要多,也许仅仅Alfred Tarski是个例外”(波普致哈耶克,1944年3月15日,转引自Hacohen 2000, 第486页)。对波普接触过的人来说,这的确是不同寻常的评价。此外,波普还把他最著名的论文集——《猜想与反驳》(Popper 1965)题献给哈耶克。另一方面,哈耶克在20世纪30年代发表的一篇论文中首次引用了波普,继而,在50和60年代,他开始频繁的引用波普,他提到自己的一篇论文“和波普的某些思想同样缜密”(Hayek [1955] 1967, 第4页)。哈耶克把他在1967年发表的文集——《对哲学、政治学和经济学的研究》题献给波普,在这本书的序言里他明确提到了波普。1982年,在一次回顾中,哈耶克提到波普的思想,“自从1934年他的Logik der Forschung(应该是《科学发现的逻辑》)面世开始,我一直完全支持他关于方法论的综合理论” (Hayek, in Weimer and Palermo 1982, 第323页)。所以,看起来我将面对大量的材料。

我着手研究之后,却一直没有开始论文的写作,这主要是因为我很快发现这两人的思想之间的关系看起来非常复杂。但是现在,借助已经公布的有关资料,以及像 Jeremy Shearmur和Malachi Hacohen这样的学者所做的高质量的研究,似乎是重新尝试的时候了。当我被邀请在此次会议上发表一篇论文时,我决定这么做了。 (more…)

flower2.jpg

grass.jpg

时 任国务院副总理的李岚清曾问中央音乐学院院长:中国有没有像贝多芬那样有分量的交响乐?院长回答:有,马思聪就有。李副总理说:好,那就演马思聪的,让人 们知道中国也有自己的交响乐。由此,中央音乐学院领导在会见马思聪女儿夫妇的时候,特意告知,北京将举行盛大的音乐会演奏马思聪先生的作品。

VS

9 月9日上午,50余位全国艺术教育界的专家学者,部分省市教育厅长,在京部分高校、中学校长积聚一堂,从发挥音乐教育的育人功能、加强人文精神教育、促进 人的全面发展等角度解读了《李岚清音乐笔谈》一书丰富深刻的内涵。“我有两个没想到,一是李岚清同志对音乐如此一往情深,二是他对音乐有如此高深的研 究。”全国政协科教文卫体委员会副主任、中国音协主席傅庚辰说:“这是我从事文艺工作半个多世纪以来,看到第一个对音乐有如此系统研究的党和国家领导 人!”

蒋梦麟先生,早年就读于南洋公学,后留学哥伦比亚大学,归国后历任第三中山大学、北京大学校长,西南联大常委,国民政府教育部长,行政院秘书长等要职。他的这本《西潮》,写就于抗战时期,重庆遭轰炸的间隙。其中细细记述了作者自幼年以来的经历,既包含个人的生活细节,也提及社会的重大事件,行文平实、淡定,正如罗家伦的序中所言:这本书最难达到的境界,就是著者讲这个极不平凡时代的事实,而以极平易近人的口吻写出来……若不是具备高度文化的修养,真实望尘莫及的。

读这本书,除了从另一个方面了解那个年代的人和事——譬如五四运动、西安事变、西南联大的建立,譬如蔡元培、陈独秀、 孙中山、蒋介石——之外,颇得我心的一点就是,末章《现代世界中的中国》对“中国文化”的分析和评介。

在这一章中,梦麟先生着重谈了“道德与理智”的问题,在我看来,的确一针见血:道德在中国文化中,始终占有了过分重要的地位,“中国思想对一切事物的观察,都以这些事物对人的关系为基础,看它们有无道德上的应用价值……(纯粹知识的)讨论再进一步,道德的意味就加强了……也可以说正因为我们注重道德,我们才重实际。因为道德系指行为而言,行为则必然要凭实际结果来判断……有时候我们也可能创出重实际重道德的思想常规,但是我们一旦发觉离开伦理范围太远时,我们马上就会收回心灵的触角。”

多年前接触启良的《中国文明史》,谈到中西神话,中国神多为道德神、人格神,而希腊神多为自然神、人物神,启良对此评价说,中国的神,徒有高高在上的尊容,毫无可爱、可亲之处。可以说,那是我第一次意识到这一点差别。之后虽然也着意观察这种区别,但始终不甚明了,此次见到梦麟先生的论述,许多问题才觉明晰。

关于近代中国历史,我始终无法厘清的一个问题是,为何社会达尔文主义,这与达尔文主义毫无相干的学说,会打着达尔文的、科学的旗号,在中国大行其道?仅仅从当时的社会环境中,无法找出令人满意的答案。
而《西潮》则指出,这是因为它契合了中国对道德价值的需求,“科学的”达尔文主义,轻易(同时是草率)地披上了一件道德的外衣,产生的就是道德化的结果——社会达尔文主义。
于是乎,“弱肉强食”、“物竞天择,适者生存”之类的口号,一经染上伦理道德的色彩,就顺理成章地成了通行的规律和准则,被大家接受下来了。
这其实是一个怪胎,自然科学、社会学说、道德功用,三者糅合在一起,配以当时中国所处的环境,终于造成了社会达尔文主义的大流行——流毒甚广,至今余孽未亡。

事实上,我还以为,在中国要做“知识分子”(Intellectual),必须突破的一道重要障碍,便是道德的藩篱。既然道德在中国文化中占据了过分重要的地位,“知识”(理智)本身便有所缺失了。所谓的“知识分子”往往道德有余,激情有余,知识不足。连基本的“知道分子”(智力)的要求尚不能达到,又怎能再上一层,做一个合格的“知识分子”呢?

Next Page »