1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski // MARKER(update_precomp.py): autogen include statement, do not remove
25*b1cdbd2cSJim Jagielski #include "precompiled_i18npool.hxx"
26*b1cdbd2cSJim Jagielski 
27*b1cdbd2cSJim Jagielski // prevent internal compiler error with MSVC6SP3
28*b1cdbd2cSJim Jagielski #include <utility>
29*b1cdbd2cSJim Jagielski 
30*b1cdbd2cSJim Jagielski #include <i18nutil/oneToOneMapping.hxx>
31*b1cdbd2cSJim Jagielski #define TRANSLITERATION_IterationMark_ja_JP
32*b1cdbd2cSJim Jagielski #include <transliteration_Ignore.hxx>
33*b1cdbd2cSJim Jagielski 
34*b1cdbd2cSJim Jagielski using namespace com::sun::star::uno;
35*b1cdbd2cSJim Jagielski using namespace com::sun::star::lang;
36*b1cdbd2cSJim Jagielski using namespace rtl;
37*b1cdbd2cSJim Jagielski 
38*b1cdbd2cSJim Jagielski namespace com { namespace sun { namespace star { namespace i18n {
39*b1cdbd2cSJim Jagielski 
40*b1cdbd2cSJim Jagielski OneToOneMappingTable_t ignoreIterationMark_ja_JP_mappingTable[] = {
41*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3046, 0x3094 ),  // HIRAGANA LETTER U --> HIRAGANA LETTER VU
42*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x304B, 0x304C ),  // HIRAGANA LETTER KA --> HIRAGANA LETTER GA
43*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x304D, 0x304E ),  // HIRAGANA LETTER KI --> HIRAGANA LETTER GI
44*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x304F, 0x3050 ),  // HIRAGANA LETTER KU --> HIRAGANA LETTER GU
45*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3051, 0x3052 ),  // HIRAGANA LETTER KE --> HIRAGANA LETTER GE
46*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3053, 0x3054 ),  // HIRAGANA LETTER KO --> HIRAGANA LETTER GO
47*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3055, 0x3056 ),  // HIRAGANA LETTER SA --> HIRAGANA LETTER ZA
48*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3057, 0x3058 ),  // HIRAGANA LETTER SI --> HIRAGANA LETTER ZI
49*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3059, 0x305A ),  // HIRAGANA LETTER SU --> HIRAGANA LETTER ZU
50*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x305B, 0x305C ),  // HIRAGANA LETTER SE --> HIRAGANA LETTER ZE
51*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x305D, 0x305E ),  // HIRAGANA LETTER SO --> HIRAGANA LETTER ZO
52*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x305F, 0x3060 ),  // HIRAGANA LETTER TA --> HIRAGANA LETTER DA
53*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3061, 0x3062 ),  // HIRAGANA LETTER TI --> HIRAGANA LETTER DI
54*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3064, 0x3065 ),  // HIRAGANA LETTER TU --> HIRAGANA LETTER DU
55*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3066, 0x3067 ),  // HIRAGANA LETTER TE --> HIRAGANA LETTER DE
56*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3068, 0x3069 ),  // HIRAGANA LETTER TO --> HIRAGANA LETTER DO
57*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x306F, 0x3070 ),  // HIRAGANA LETTER HA --> HIRAGANA LETTER BA
58*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3072, 0x3073 ),  // HIRAGANA LETTER HI --> HIRAGANA LETTER BI
59*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3075, 0x3076 ),  // HIRAGANA LETTER HU --> HIRAGANA LETTER BU
60*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x3078, 0x3079 ),  // HIRAGANA LETTER HE --> HIRAGANA LETTER BE
61*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x307B, 0x307C ),  // HIRAGANA LETTER HO --> HIRAGANA LETTER BO
62*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x309D, 0x309E ),  // HIRAGANA ITERATION MARK --> HIRAGANA VOICED ITERATION MARK
63*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30A6, 0x30F4 ),  // KATAKANA LETTER U --> KATAKANA LETTER VU
64*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30AB, 0x30AC ),  // KATAKANA LETTER KA --> KATAKANA LETTER GA
65*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30AD, 0x30AE ),  // KATAKANA LETTER KI --> KATAKANA LETTER GI
66*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30AF, 0x30B0 ),  // KATAKANA LETTER KU --> KATAKANA LETTER GU
67*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30B1, 0x30B2 ),  // KATAKANA LETTER KE --> KATAKANA LETTER GE
68*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30B3, 0x30B4 ),  // KATAKANA LETTER KO --> KATAKANA LETTER GO
69*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30B5, 0x30B6 ),  // KATAKANA LETTER SA --> KATAKANA LETTER ZA
70*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30B7, 0x30B8 ),  // KATAKANA LETTER SI --> KATAKANA LETTER ZI
71*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30B9, 0x30BA ),  // KATAKANA LETTER SU --> KATAKANA LETTER ZU
72*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30BB, 0x30BC ),  // KATAKANA LETTER SE --> KATAKANA LETTER ZE
73*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30BD, 0x30BE ),  // KATAKANA LETTER SO --> KATAKANA LETTER ZO
74*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30BF, 0x30C0 ),  // KATAKANA LETTER TA --> KATAKANA LETTER DA
75*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30C1, 0x30C2 ),  // KATAKANA LETTER TI --> KATAKANA LETTER DI
76*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30C4, 0x30C5 ),  // KATAKANA LETTER TU --> KATAKANA LETTER DU
77*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30C6, 0x30C7 ),  // KATAKANA LETTER TE --> KATAKANA LETTER DE
78*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30C8, 0x30C9 ),  // KATAKANA LETTER TO --> KATAKANA LETTER DO
79*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30CF, 0x30D0 ),  // KATAKANA LETTER HA --> KATAKANA LETTER BA
80*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30D2, 0x30D3 ),  // KATAKANA LETTER HI --> KATAKANA LETTER BI
81*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30D5, 0x30D6 ),  // KATAKANA LETTER HU --> KATAKANA LETTER BU
82*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30D8, 0x30D9 ),  // KATAKANA LETTER HE --> KATAKANA LETTER BE
83*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30DB, 0x30DC ),  // KATAKANA LETTER HO --> KATAKANA LETTER BO
84*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30EF, 0x30F7 ),  // KATAKANA LETTER WA --> KATAKANA LETTER VA
85*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30F0, 0x30F8 ),  // KATAKANA LETTER WI --> KATAKANA LETTER VI
86*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30F1, 0x30F9 ),  // KATAKANA LETTER WE --> KATAKANA LETTER VE
87*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30F2, 0x30FA ),  // KATAKANA LETTER WO --> KATAKANA LETTER VO
88*b1cdbd2cSJim Jagielski     MAKE_PAIR( 0x30FD, 0x30FE )   // KATAKANA ITERATION MARK --> KATAKANA VOICED ITERATION MARK
89*b1cdbd2cSJim Jagielski };
90*b1cdbd2cSJim Jagielski 
91*b1cdbd2cSJim Jagielski 
92*b1cdbd2cSJim Jagielski OUString SAL_CALL
folding(const OUString & inStr,sal_Int32 startPos,sal_Int32 nCount,Sequence<sal_Int32> & offset)93*b1cdbd2cSJim Jagielski ignoreIterationMark_ja_JP::folding( const OUString& inStr, sal_Int32 startPos, sal_Int32 nCount, Sequence< sal_Int32 >& offset )
94*b1cdbd2cSJim Jagielski   throw(RuntimeException)
95*b1cdbd2cSJim Jagielski {
96*b1cdbd2cSJim Jagielski     oneToOneMapping aTable(ignoreIterationMark_ja_JP_mappingTable, sizeof(ignoreIterationMark_ja_JP_mappingTable));
97*b1cdbd2cSJim Jagielski 
98*b1cdbd2cSJim Jagielski     // Create a string buffer which can hold nCount + 1 characters.
99*b1cdbd2cSJim Jagielski     // The reference count is 0 now.
100*b1cdbd2cSJim Jagielski     rtl_uString * newStr = x_rtl_uString_new_WithLength( nCount ); // defined in x_rtl_ustring.h
101*b1cdbd2cSJim Jagielski     sal_Unicode * dst = newStr->buffer;
102*b1cdbd2cSJim Jagielski     const sal_Unicode * src = inStr.getStr() + startPos;
103*b1cdbd2cSJim Jagielski 
104*b1cdbd2cSJim Jagielski     sal_Int32 * p = 0;
105*b1cdbd2cSJim Jagielski     sal_Int32 position = 0;
106*b1cdbd2cSJim Jagielski     if (useOffset) {
107*b1cdbd2cSJim Jagielski         // Allocate nCount length to offset argument.
108*b1cdbd2cSJim Jagielski         offset.realloc( nCount );
109*b1cdbd2cSJim Jagielski         p = offset.getArray();
110*b1cdbd2cSJim Jagielski         position = startPos;
111*b1cdbd2cSJim Jagielski     }
112*b1cdbd2cSJim Jagielski 
113*b1cdbd2cSJim Jagielski     //
114*b1cdbd2cSJim Jagielski     sal_Unicode previousChar = *src ++;
115*b1cdbd2cSJim Jagielski     sal_Unicode currentChar;
116*b1cdbd2cSJim Jagielski 
117*b1cdbd2cSJim Jagielski     // Conversion
118*b1cdbd2cSJim Jagielski     while (-- nCount > 0) {
119*b1cdbd2cSJim Jagielski         currentChar = *src ++;
120*b1cdbd2cSJim Jagielski 
121*b1cdbd2cSJim Jagielski         switch ( currentChar ) {
122*b1cdbd2cSJim Jagielski             case 0x30fd: // KATAKANA ITERATION MARK
123*b1cdbd2cSJim Jagielski             case 0x309d: // HIRAGANA ITERATION MARK
124*b1cdbd2cSJim Jagielski             case 0x3005: // IDEOGRAPHIC ITERATION MARK
125*b1cdbd2cSJim Jagielski                 currentChar = previousChar;
126*b1cdbd2cSJim Jagielski                 break;
127*b1cdbd2cSJim Jagielski             case 0x30fe: // KATAKANA VOICED ITERATION MARK
128*b1cdbd2cSJim Jagielski             case 0x309e: // HIRAGANA VOICED ITERATION MARK
129*b1cdbd2cSJim Jagielski                 currentChar = aTable[ previousChar ];
130*b1cdbd2cSJim Jagielski                 break;
131*b1cdbd2cSJim Jagielski         }
132*b1cdbd2cSJim Jagielski         if (useOffset)
133*b1cdbd2cSJim Jagielski             *p ++ = position ++;
134*b1cdbd2cSJim Jagielski         *dst ++ = previousChar;
135*b1cdbd2cSJim Jagielski         previousChar = currentChar;
136*b1cdbd2cSJim Jagielski     }
137*b1cdbd2cSJim Jagielski 
138*b1cdbd2cSJim Jagielski     if (nCount == 0) {
139*b1cdbd2cSJim Jagielski         if (useOffset)
140*b1cdbd2cSJim Jagielski             *p = position;
141*b1cdbd2cSJim Jagielski         *dst ++ = previousChar;
142*b1cdbd2cSJim Jagielski     }
143*b1cdbd2cSJim Jagielski 
144*b1cdbd2cSJim Jagielski     *dst = (sal_Unicode) 0;
145*b1cdbd2cSJim Jagielski 
146*b1cdbd2cSJim Jagielski     newStr->length = sal_Int32(dst - newStr->buffer);
147*b1cdbd2cSJim Jagielski     if (useOffset)
148*b1cdbd2cSJim Jagielski         offset.realloc(newStr->length);
149*b1cdbd2cSJim Jagielski     return OUString( newStr, SAL_NO_ACQUIRE ); // take over ownership of <newStr>
150*b1cdbd2cSJim Jagielski 
151*b1cdbd2cSJim Jagielski }
152*b1cdbd2cSJim Jagielski 
153*b1cdbd2cSJim Jagielski } } } }
154