文章
Slash Boxes
评论

用计算机挖掘文学作品中的隐喻

matrix 发表于 2009年3月10日 17时25分 星期二   Printer-friendly   Email story
来自小三要失业了部门
去年有本比较受关注的名著译本问世:隐居作家托马斯品钦的后现代主义代表作《万有引力之虹》,译者穷三年之力才翻完。本书以内容复杂晦涩,隐喻深刻著称。在数据挖掘的时代,如果我们能对所有书籍进行索引分析,或许能解开隐含的意义。现在斯坦福大学的研究人员正构建一个浩瀚的,可搜寻的数据库,容纳一切文学作品,利用“数据挖掘”和“机器学习”技术,挖掘出从柏拉图到品钦作品文字中的隐喻 研究者能搜寻包含在书籍中的数百万个字,研究这些单字如何被使用的微妙转变,分析语言-文化-如何演变。举例来说,“在结构上来说,'my love is a red rose (我的爱是一朵红玫瑰)'这句话与‘my dog is a blue heeler ’(我的狗是蓝色heeler,译注:澳大利亚牛狗的原名) 非常类似,但前者是隐喻,但后者不是。”研究人员用程序在可能使用隐喻的单字之间进行近似搜寻,如以“mind”和“mint”搜寻100字内的例句,结果找到下列William Cowper的诗句:“The mind and conduct mutually imprint(心智与行为相互铭印)/And stamp their image in each other's mint(并将其形象留在彼此的铸印)”。

相关文章

IT: 托马斯品钦和加密技术 [+]
托马斯品钦(Thomas Ruggles Pynchon)是一位具有神秘色彩的隐居小说家,他获得过麦克阿瑟奖和布克奖,和诺贝尔文学奖提名。其作品被普遍认为晦涩难懂,主题涉及到历史、自然科学和数学等不同领域,代表作包括《V.》,《叫卖第49组(The Crying of Lot 49)》,《万有引力之虹》(国内刚刚出版了其中文版)等。其中《叫卖第49组》篇幅较短,只有一百多页,不像其它作品是动辄上千页的砖头。 根据维基百科的介绍,Adobe公司硅谷总部楼顶上的艺术展示跟此小说有关:Adobe楼顶有四个信号灯(名叫San Jose Semaphore),每7.2秒它们的角度就会变一次。这个名叫“圣何塞旗语”的灯确实在传送一个加密过的信息。2006年两位工程师终于破解了密码——原来圣何塞旗语一年四季随时都在传送《叫卖第49组》的全文(密码细节破解过程)。CIA在兰利的总部也有一个类似含有密码的公众艺术,叫克里普托斯Krpytos),据说至今都未能全部破解。
This discussion has been archived. No new comments can be posted.
显示选项 门槛:
声明: 下面的评论属于其发表者所有,不代表本站的观点和立场,我们不负责他们说什么。