Page 1 of 1

Batch find replace Hebrew whole words

Posted: Fri Oct 18, 2013 9:23 am
by alexenposadas
Hi :) I'm grateful to be able to use your program! Thank you very much :)

My Hebrew New Testament text I wish to process looks like this:

Matthew 1:1 סֵפֶר תּוֹלְדֹת יֵשׁוּעַ הַמָּשִׁיחַ בֶּן ־ דָּוִד בֶּן ־ אַבְרָהָם ׃
Matthew 1:2 אַבְרָהָם הוֹלִיד אֶת ־ יִצְחָק וְיִצְחָק הוֹלִיד אֶת ־ יַעֲקֹב וְיַעֲקֹב הוֹלִיד אֶת ־ יְהוּדָה וְאֶת ־ אֶחָיו ׃
Matthew 1:3 וִיהוּדָה הוֹלִיד אֶת ־ פֶּרֶץ וְאֶת ־ זֶרַח מִתָּמָר וּפֶרֶץ הוֹלִיד אֶת ־ חֶצְרוֹן וְחֶצְרוֹן הוֹלִיד אֶת ־ רָם ׃
Matthew 1:4 וְרָם הוֹלִיד אֶת ־ עַמִּינָדָב וְעַמִּינָדָב הוֹלִיד אֶת ־ נַחְשׁוֹן וְנַחְשׁוֹן הוֹלִיד אֶת ־ שַׂלְמוֹן ׃
Matthew 1:5 וְשַׂלְמוֹן הוֹלִיד אֶת ־ בֹּעַז מֵרָחָב וְבֹעַז הוֹלִיד אֶת ־ עוֹבֵד מֵרוּת וְעוֹבֵד הוֹלִיד אֶת ־ יִשָׁי ׃
Matthew 1:6 וְיִשַׁי הוֹלִיד אֶת ־ דָּוִד הַמֶּלֶךְ וְדָוִד הַמֶּלֶךְ הוֹלִיד אֶת ־ שְׁלֹמֹה מֵאֵשֶׁת אוּרִיָּה ׃
Matthew 1:7 וּשְׁלֹמֹה הוֹלִיד אֶת ־ רְחַבְעָם וּרְחַבְעָם הוֹלִיד אֶת ־ אֲבִיָּה וַאֲבִיָּה הוֹלִיד אֶת ־ אָסָא ׃
Matthew 1:8 וְאָסָא הוֹלִיד אֶת ־ יְהוֹשָׁפָט וִיהוֹשָׁפָט הוֹלִיד אֶת ־ יוֹרָם וְיוֹרָם הוֹלִיד אֶת עֻזִּיָּהוּ ׃
Matthew 1:9 וְעֻזִּיָּהוּ הוֹלִיד אֶת ־ יוֹתָם וְיוֹתָם הוֹלִיד אֶת ־ אָחָז וְאָחָז הוֹלִיד אֶת ־ יְחִזְקִיָּהוּ ׃
Matthew 1:10 וִיחִזְקִיָּהוּ הוֹלִיד אֶת ־ מְנַשֶׁה וּמְנַשֶׁה הוֹלִיד אֶת ־ אָמוֹן וְאָמוֹן הוֹלִיד אֶת ־ יֹאשִׁיָּהוּ ׃

And my list of pairs to find/replace looks like this:

Column A Column B
סֵפֶר H5612 סֵפֶר
תּוֹלְדֹת H8435 תּוֹלְדֹת
יֵשׁוּעַ H3442 יֵשׁוּעַ
אַבְרָהָם H85 אַבְרָהָם
אֶת H853 אֶת
וְאָחָז H271 וְאָחָז

In other words, my goal is to add these lexicon codes to my Hebrew text.

A bulk find/replace procedure with just "Match whole words only" would do the job.
However, because these are Hebrew characters, for some reason I'm not getting the expected results as easily as I normally would.

Can you think of a better way to accomplish this?
Thank you,
Alex

Re: Batch find replace Hebrew whole words

Posted: Fri Oct 18, 2013 10:50 am
by DigitalVolcano
It looks like TextCrawler is having a problem with Right-to-Left text (i.e. Hebrew). It seems to be putting the replace at the wrong end of the line. Is this the same problem you are having?

There is support for RTL regular expressions in .NET, but it isn't implemented in TextCrawler yet. I've added this to the to-do list and we'll try and fix it!