一文解決原文(rpr)標簽翻譯難題!
最近有好多客戶伙伴和朋友伙伴經(jīng)常來問我一個問題:原文中有很多標簽,尤其是 rpr 的標簽,影響了譯員翻譯。
如果是以前,我可能會直接回復(fù):這是源文檔的問題,建議做譯前處理。
——可,這并不解決客戶的問題。
如果我是客戶,我下一個問題肯定會接著問:“我知道問題,怎么解決。”(是的,問題不重要,先解決問題比較重要。)
所以,今天我就來分享:翻譯原文中的標簽到底是怎么來的?如何處理和解決?
要解決這個問題,首先我們得問:標簽是哪來的?
一、標簽是哪來的?
首先我們要明確一點:memoQ 作為一款專業(yè)的 TMS(翻譯管理系統(tǒng)) 工具,如果源文檔沒有,它不會平白無故生成標簽。就像我們做翻譯,原文沒有,譯員不能平白無故造,這不忠實。
所以,標簽?zāi)睦飦淼模俊隙ㄊ?strong>來自于源文檔。——來自于源文檔的什么呢?
1.1 標簽的分類
我會把標簽分為兩類:
(1)結(jié)構(gòu)化標簽,用于關(guān)聯(lián)文檔的特定結(jié)構(gòu)或元素。
如下圖所示:emphasis標簽對就是結(jié)構(gòu)化標簽。
關(guān)于結(jié)構(gòu)化標簽,我前面講 XML 時其實講過。
詳見:
認識XML文檔(二)XML的元素、標簽、文本、屬性和實體https://mp.weixin.qq.com/s/hPpqgFIna9JkKcBz1ULbUw 和 如何翻譯單語XML文檔?https://mp.weixin.qq.com/s/a5arsW9LDFHcpPoMyVsGSw
(2)格式標簽,用于維持源文檔的外觀和布局,比如文字加粗、傾斜、下劃線和字體等。
如下圖所示:原文的一句話,Go global with memoQ ,分別用了不同的顏色。
那,有小伙伴可能會想:我就是一個做翻譯的,我為什么要區(qū)分格式化標簽和結(jié)構(gòu)化標簽?zāi)??不要著急,繼續(xù)往下看。
其實,不論是結(jié)構(gòu)化標簽,還是格式化標簽,我們都可以綜合分為兩類:
- 翻譯時,要保留的標簽;
- 翻譯時,可以不要的標簽。
- 結(jié)構(gòu)化標簽,必須保留。
- 格式化標要不要,取決于源文檔和客戶要求。
1.2 為什么要保留結(jié)構(gòu)化標簽?
結(jié)構(gòu)化標簽描述了文檔的邏輯結(jié)構(gòu)和布局,例如段落、標題、列表等。這些標簽是文檔的核心組成部分,它們定義了文檔的基本框架。- 有些文件,尤其是代碼文件,如果譯文中沒有<emphasis>標簽對,你的譯文就少了東西,甚至會導致程序無法運行。前兩天我跟另一個客戶在聊天時,就提到了一下關(guān)于保留格式化標簽的重要性。

- 對于 Office 系列的文檔而言,如果結(jié)構(gòu)化標簽丟失,翻譯結(jié)束就無法導出譯文。所以很多小伙伴之前出現(xiàn)過"已翻譯XML與原文的結(jié)構(gòu)不一致",導致譯文無法導出?!皇且淮危呛芏嗪芏嗪芏啻蝵


- 保持內(nèi)容完整性:丟失或更改結(jié)構(gòu)化標簽可能導致文檔的邏輯結(jié)構(gòu)和流程被破壞,從而使最終翻譯的文檔難以理解或使用。
- 可訪問性:許多結(jié)構(gòu)化標簽還對輔助技術(shù)(如屏幕閱讀器)有特殊意義,保留它們有助于確保所有用戶都能訪問內(nèi)容。
1.3 如何處理格式化標簽?
格式化標簽用于控制文檔中文本的外觀,例如字體、顏色、對齊方式等,因此它們對文檔的整體意義和結(jié)構(gòu)的影響較小。所以,是否保留格式化標簽,取決于:- 源文檔的目的和風格:如果源文檔的格式對傳達其意圖和風格至關(guān)重要,則應(yīng)保留這些標簽,比如上標下標。如果影響較小,就不需要。
- 客戶要求和期望:有些客戶可能希望翻譯后的文檔保留原文檔的所有格式,而另一些客戶可能不關(guān)心格式問題。在開始翻譯項目之前,了解客戶的具體要求是非常重要的?!@就是客戶要求交付的質(zhì)量。
- 工具和平臺的兼容性:使用的翻譯工具和目標平臺可能會影響格式化標簽的處理。有些工具可能能夠輕松保留這些標簽,而其他工具可能會導致問題。

二、如何處理原文中的標簽?
前面講了,標簽有:- 要保留的,
- 和不保留的。
2.1 翻譯時,如何保留標簽
其實前面講過,對于要保留的標簽,我們需要保證譯文標簽和原文標簽一致,- 既要保證原文標簽在譯文中數(shù)量一致,如原文有幾個標簽,譯文就要有幾個標簽;
- 又要保證譯文的標簽對與原文一致,原文中的<text>和</text>要形成一對標簽對。
詳見:如何處理原文中的標簽https://mp.weixin.qq.com/s/uEbCln9C-h7kycMJHvMXkg
2.1.1 復(fù)制標簽
方法一:用快捷鍵復(fù)制標簽。你可以直接將原文標簽進行復(fù)制,粘貼在譯文標簽所在位置處:Step 1: 選中原文標簽,按下Ctrl+C,或者右鍵選擇復(fù)制;Step 2: 把鼠標放在譯文位置,按下Ctrl+V,或者右鍵選擇粘貼。
- 第一組標簽序列是第一個標簽<rpr>;
- 第二組標簽序列是第二和第三個標簽</rpr><rpr>;
- 第三組標簽序列是最后一個標簽</rpr>;

2.1.2 插入標簽
如果你不喜歡用鍵盤快捷鍵,你也可以使用"插入標簽",將標簽按順序插入在譯文位置:Step 1: 點擊菜單欄"快速訪問"或"編輯"中的"插入標簽"按鈕,然后即可在譯文句段處看到有個標簽的小標識。Step 2: 然后就可以直接按順序插入標簽了。
2.1.3 刪除標簽
如果譯文標簽插入錯誤呢?我可以刪除標簽,再重新插入嘛對不對~刪除標簽,你可以:- 直接刪除即可;
- 如果你點擊了"插入標簽"按鈕,你還可以把鼠標放在要刪除的標簽上,即可在標簽上出現(xiàn)如下圖所示的按鈕,點擊該標簽,即可刪除。

2.1.4 如何判斷標簽是否在正確位置呢?
標簽插入在正確位置后,你會在下方預(yù)覽區(qū)看到插入后正確的格式。


2.2 如何處理不需要保留的標簽?
如下圖所示,如果我的原文導入后是這樣的:
2.2.1 導入 memoQ 前,通過譯前處理清除標簽
其實如果做譯前處理,有很多方法。(1)對于 Excel 文檔而言,我可以通過“清除格式”、“清除規(guī)則”、“格式刷”等方式,來進行譯前處理。比如下圖我就是通過“清除格式”+“清除所選單元格規(guī)則”,只處理了 D 列原文列的格式。


另存另存?。?!不要完全替換源文檔?。。。∮肋h要保留一份源文檔?。?!記住?。?!

- 翻譯開始前,
- 翻譯已經(jīng)開始或者完成后。
2.2.2 翻譯開始前,借助 memoQ 清除標簽
如果還沒開始翻譯,那就簡單了。既然不要格式,那就兩部走:- 快速將原文復(fù)制到譯文 ->
- 一鍵清除全部標簽。
我已經(jīng)很熟練了,所以我這個操作用了 2 秒。如果你不熟練,去學:快速將原文復(fù)制到譯文

”編輯“ -> 標簽 -> 標簽命令下面,也可以看到快捷鍵。

- 即使沒開始翻譯,對于游戲和應(yīng)用程序本地化而言的文檔,如果原文列和譯文列是一列,沒問題。因為我譯文直接替換原文列了。
- 可,如果是多語言的 Excel,原文列譯文列都不在同一列,怎么辦?
- 或者其他格式的文本的話,翻譯已經(jīng)開始了,已經(jīng)有譯文了,我肯定不能復(fù)制到譯文呀,怎么辦?
2.2.3 翻譯開始后或者翻譯完成后,借助 memoQ 清除標簽
在這里,我們可以借助memoQ的用正則表達式查找和替換原文標簽的功能,來實現(xiàn)。在正式操作前,一名專業(yè)的項目經(jīng)理,一定要記得~什么來著~——是的!風險管理?。?!萬一操作有問題,怎么還原~所以:操作前風險管理:
Step 1:創(chuàng)建快照,這樣即使誤操作,可以還原。- 選中該文檔 -> 統(tǒng)計/準備 -> 版本 -> 創(chuàng)建快照;



- 選中該文檔 -> 導出下拉菜單 -> 導出雙語 -> 導出。


具體操作為:
Step 1:開啟替換原文的功能:在 ① “選項” -> ② "翻譯" -> 開啟 ③ “原文句段允許替換”的功能 -> ④ “確認” 即可。詳見:

關(guān)于正則查找替換,詳見:正則篇(三):用正則在CAT中查找和替換以替換rpr標簽對為例。第一次查找替換先處理rpr的開標簽:
- 查找<rpr.*?[^/]>
- 替換:什么都不填,空。


- 查找</rpr*?>
- 替換:什么都不填,空。



2.2.4 可能存在的問題:
1. 我怎么知道有哪些標簽?zāi)兀?/b>
- 隨便找一個譯文有標簽的句子 -> 點擊菜單欄“標簽命令” -> 編輯行內(nèi)標簽
- 即可在行內(nèi)標簽名稱看到原文所有的標簽名字。
如果譯文為空,可以復(fù)制原文至譯文,再執(zhí)行后續(xù)操作即可;

2. 我怎么知道哪些標簽可以刪,哪些不能刪呢?
需要 PM 或者負責處理源文檔的小伙伴來認為判斷。推薦嘗試的方法是:找?guī)讉€涵蓋對應(yīng)標簽的句子,譯文刪掉改標簽,導出譯文后,對照譯文和原文查看是否會影響。總之,方法總比困難多~好啦,希望你上內(nèi)容可以幫到你,有用可收藏~特別說明:本文僅用于學術(shù)交流,如有侵權(quán)請后臺聯(lián)系小編刪除。
- END -
轉(zhuǎn)載來源:職業(yè)譯員玩轉(zhuǎn)翻譯技術(shù)
轉(zhuǎn)載編輯:陳柯淼