1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski // MARKER(update_precomp.py): autogen include statement, do not remove
25*b1cdbd2cSJim Jagielski #include "precompiled_i18npool.hxx"
26*b1cdbd2cSJim Jagielski 
27*b1cdbd2cSJim Jagielski #include <inputsequencechecker_th.hxx>
28*b1cdbd2cSJim Jagielski #include <wtt.h>
29*b1cdbd2cSJim Jagielski 
30*b1cdbd2cSJim Jagielski using namespace rtl;
31*b1cdbd2cSJim Jagielski 
32*b1cdbd2cSJim Jagielski namespace com { namespace sun { namespace star { namespace i18n {
33*b1cdbd2cSJim Jagielski 
InputSequenceChecker_th()34*b1cdbd2cSJim Jagielski InputSequenceChecker_th::InputSequenceChecker_th()
35*b1cdbd2cSJim Jagielski {
36*b1cdbd2cSJim Jagielski 	serviceName = "com.sun.star.i18n.InputSequenceChecker_th";
37*b1cdbd2cSJim Jagielski }
38*b1cdbd2cSJim Jagielski 
~InputSequenceChecker_th()39*b1cdbd2cSJim Jagielski InputSequenceChecker_th::~InputSequenceChecker_th()
40*b1cdbd2cSJim Jagielski {
41*b1cdbd2cSJim Jagielski }
42*b1cdbd2cSJim Jagielski 
43*b1cdbd2cSJim Jagielski /* Table for Thai Cell Manipulation */
44*b1cdbd2cSJim Jagielski sal_Char _TAC_celltype_inputcheck[17][17] = {
45*b1cdbd2cSJim Jagielski /* Cn */ /*	 0,   1,   2,   3,   4,   5,   6,   7,   8,   9,   A,   B,   C,   D,   E,   F	    */
46*b1cdbd2cSJim Jagielski /* Cn-1 00 */{	'X', 'A', 'A', 'A', 'A', 'A', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
47*b1cdbd2cSJim Jagielski      /* 10 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
48*b1cdbd2cSJim Jagielski      /* 20 */{	'X', 'A', 'A', 'A', 'A', 'S', 'A', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C' },
49*b1cdbd2cSJim Jagielski      /*	30 */{	'X', 'S', 'A', 'S', 'S', 'S', 'S', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
50*b1cdbd2cSJim Jagielski      /* 40 */{	'X', 'A', 'A', 'A', 'A', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
51*b1cdbd2cSJim Jagielski      /* 50 */{	'X', 'A', 'A', 'A', 'A', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
52*b1cdbd2cSJim Jagielski      /* 60 */{	'X', 'A', 'A', 'A', 'S', 'A', 'S', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
53*b1cdbd2cSJim Jagielski      /* 70 */{	'X', 'A', 'A', 'A', 'A', 'S', 'A', 'R', 'R', 'R', 'C', 'C', 'R', 'R', 'R', 'R', 'R' },
54*b1cdbd2cSJim Jagielski      /* 80 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'C', 'R', 'R', 'R', 'R', 'R', 'R' },
55*b1cdbd2cSJim Jagielski      /* 90 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
56*b1cdbd2cSJim Jagielski      /* A0 */{	'X', 'A', 'A', 'A', 'A', 'A', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
57*b1cdbd2cSJim Jagielski      /* B0 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
58*b1cdbd2cSJim Jagielski      /* C0 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
59*b1cdbd2cSJim Jagielski      /* D0 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R' },
60*b1cdbd2cSJim Jagielski      /* E0 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'C', 'C', 'R', 'R', 'R', 'R', 'R' },
61*b1cdbd2cSJim Jagielski      /* F0 */{	'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'C', 'R', 'R', 'R', 'R', 'R', 'R' },
62*b1cdbd2cSJim Jagielski 		 { 'X', 'A', 'A', 'A', 'S', 'S', 'A', 'R', 'R', 'R', 'C', 'R', 'C', 'R', 'R', 'R', 'R' }
63*b1cdbd2cSJim Jagielski };
64*b1cdbd2cSJim Jagielski 
65*b1cdbd2cSJim Jagielski sal_Bool _TAC_Composible[3][5] = {
66*b1cdbd2cSJim Jagielski 		/*  'A',	'C',		'S',		'R',		'X'   */
67*b1cdbd2cSJim Jagielski /* Mode 0 */    {sal_True,	sal_True,	sal_True,	sal_True,	sal_True}, // PASSTHROUGH = 0
68*b1cdbd2cSJim Jagielski /* Mode 1 */    {sal_True,	sal_True,	sal_True,	sal_False,  	sal_True}, // BASIC = 1
69*b1cdbd2cSJim Jagielski /* Mode 2 */    {sal_True,	sal_True,	sal_False,  	sal_False,  	sal_True}  // STRICT = 2
70*b1cdbd2cSJim Jagielski };
71*b1cdbd2cSJim Jagielski 
check(sal_Unicode ch1,sal_Unicode ch2,sal_Int16 inputCheckMode)72*b1cdbd2cSJim Jagielski static sal_Bool SAL_CALL check(sal_Unicode ch1, sal_Unicode ch2, sal_Int16 inputCheckMode)
73*b1cdbd2cSJim Jagielski {
74*b1cdbd2cSJim Jagielski 	sal_Int16  composible_class;
75*b1cdbd2cSJim Jagielski 	switch (_TAC_celltype_inputcheck[getCharType(ch1)][getCharType(ch2)]) {
76*b1cdbd2cSJim Jagielski 	    case 'A': composible_class = 0; break;
77*b1cdbd2cSJim Jagielski 	    case 'C': composible_class = 1; break;
78*b1cdbd2cSJim Jagielski 	    case 'S': composible_class = 2; break;
79*b1cdbd2cSJim Jagielski 	    case 'R': composible_class = 3; break;
80*b1cdbd2cSJim Jagielski 	    case 'X': composible_class = 4; break;
81*b1cdbd2cSJim Jagielski 	    default:  composible_class = 0;
82*b1cdbd2cSJim Jagielski 	}
83*b1cdbd2cSJim Jagielski 	return (_TAC_Composible[inputCheckMode][composible_class]);
84*b1cdbd2cSJim Jagielski }
85*b1cdbd2cSJim Jagielski 
86*b1cdbd2cSJim Jagielski sal_Bool SAL_CALL
checkInputSequence(const OUString & Text,sal_Int32 nStartPos,sal_Unicode inputChar,sal_Int16 inputCheckMode)87*b1cdbd2cSJim Jagielski InputSequenceChecker_th::checkInputSequence(const OUString& Text, sal_Int32 nStartPos,
88*b1cdbd2cSJim Jagielski 	sal_Unicode inputChar, sal_Int16 inputCheckMode) throw(com::sun::star::uno::RuntimeException)
89*b1cdbd2cSJim Jagielski {
90*b1cdbd2cSJim Jagielski     return check(Text[nStartPos], inputChar, inputCheckMode);
91*b1cdbd2cSJim Jagielski }
92*b1cdbd2cSJim Jagielski 
93*b1cdbd2cSJim Jagielski sal_Int32 SAL_CALL
correctInputSequence(OUString & Text,sal_Int32 nStartPos,sal_Unicode inputChar,sal_Int16 inputCheckMode)94*b1cdbd2cSJim Jagielski InputSequenceChecker_th::correctInputSequence(OUString& Text,
95*b1cdbd2cSJim Jagielski                                             sal_Int32       nStartPos,
96*b1cdbd2cSJim Jagielski                                             sal_Unicode     inputChar,
97*b1cdbd2cSJim Jagielski                                             sal_Int16       inputCheckMode)
98*b1cdbd2cSJim Jagielski   throw(com::sun::star::uno::RuntimeException)
99*b1cdbd2cSJim Jagielski {
100*b1cdbd2cSJim Jagielski /* 9 rules for input sequence correction, see issue i42661 for detail,
101*b1cdbd2cSJim Jagielski 
102*b1cdbd2cSJim Jagielski http://www.openoffice.org/issues/show_bug.cgi?id=42661
103*b1cdbd2cSJim Jagielski 
104*b1cdbd2cSJim Jagielski <abv> = <av1>|<av2>|<av3>|<bv1>|<bv2>
105*b1cdbd2cSJim Jagielski <abv1> = <av1>|<bv1>
106*b1cdbd2cSJim Jagielski <thanthakhat> = 0E4C (karan)
107*b1cdbd2cSJim Jagielski 
108*b1cdbd2cSJim Jagielski 1. <cons> <abv>_x + <abv>_y => <cons> <abv>_y (replace)
109*b1cdbd2cSJim Jagielski 2. <cons> <tone>_x + <tone>_y => <cons> <tone>_y (replace)
110*b1cdbd2cSJim Jagielski 3. <cons> <abv> <tone>_x + <tone>_y => <cons> <abv> <tone>_y (replace)
111*b1cdbd2cSJim Jagielski 4. <cons> <abv>_x <tone> + <abv>_y => <cons> <abv>_y <tone> (replace, reorder)
112*b1cdbd2cSJim Jagielski 5. <cons> <tone> + <abv> => <cons> <abv> <tone> (reorder)
113*b1cdbd2cSJim Jagielski 6. <cons> <fv1> + <tone> => <cons> <tone> <fv1> (reorder)
114*b1cdbd2cSJim Jagielski 7. <cons> <tone>_x <fv1> + <tone>_y => <cons> <tone>_y <fv1> (replace, reorder)
115*b1cdbd2cSJim Jagielski 8. <cons> <thanthakhat> + <abv1> => <cons> <abv1> <thanthakhat> (reorder)
116*b1cdbd2cSJim Jagielski 9. <cons> <abv1>_x <thanthakhat> + <abv1>_y => <cons> <abv1>_y <thanthakhat>(reorder, replace)
117*b1cdbd2cSJim Jagielski */
118*b1cdbd2cSJim Jagielski #define CT_ABV(t)  ( (t>=CT_AV1 && t<=CT_AV3) || t==CT_BV1 || t==CT_BV2)
119*b1cdbd2cSJim Jagielski #define CT_ABV1(t) (t==CT_AV1 || t==CT_BV1)
120*b1cdbd2cSJim Jagielski 
121*b1cdbd2cSJim Jagielski     if (check(Text[nStartPos], inputChar, inputCheckMode))
122*b1cdbd2cSJim Jagielski         Text = Text.replaceAt(++nStartPos, 0, OUString(inputChar));
123*b1cdbd2cSJim Jagielski     else if (nStartPos > 0 && getCharType(Text[nStartPos-1]) == CT_CONS) {
124*b1cdbd2cSJim Jagielski         sal_uInt16 t1=getCharType(Text[nStartPos]), t2=getCharType(inputChar);
125*b1cdbd2cSJim Jagielski         if ( (CT_ABV(t1) && CT_ABV(t2)) || // 1.
126*b1cdbd2cSJim Jagielski                 (t1==CT_TONE && t2==CT_TONE) )// 2.
127*b1cdbd2cSJim Jagielski             Text = Text.replaceAt(nStartPos, 1, OUString(inputChar));
128*b1cdbd2cSJim Jagielski         else if ( (t1==CT_TONE && CT_ABV(t2)) ||  // 5.
129*b1cdbd2cSJim Jagielski                 (t1==CT_FV1 && t2==CT_TONE) ||  // 6.
130*b1cdbd2cSJim Jagielski                 (Text[nStartPos]==0x0E4C && CT_ABV1(t2)) ) // 8.
131*b1cdbd2cSJim Jagielski             Text = Text.replaceAt(nStartPos++, 0, OUString(inputChar));
132*b1cdbd2cSJim Jagielski         else
133*b1cdbd2cSJim Jagielski             nStartPos=Text.getLength();
134*b1cdbd2cSJim Jagielski     } else if (nStartPos > 1 && getCharType(Text[nStartPos-2]) == CT_CONS) {
135*b1cdbd2cSJim Jagielski         sal_uInt16 t1=getCharType(Text[nStartPos-1]), t2=getCharType(Text[nStartPos]), t3=getCharType(inputChar);
136*b1cdbd2cSJim Jagielski         if (CT_ABV(t1) && t2==CT_TONE && t3==CT_TONE) // 3.
137*b1cdbd2cSJim Jagielski             Text = Text.replaceAt(nStartPos, 1, OUString(inputChar));
138*b1cdbd2cSJim Jagielski         else if ( (CT_ABV(t1) && t2==CT_TONE && CT_ABV(t3)) || // 4.
139*b1cdbd2cSJim Jagielski                 (t1==CT_TONE && t2==CT_FV1 && t3==CT_TONE) || // 7.
140*b1cdbd2cSJim Jagielski                 (CT_ABV1(t1) && Text[nStartPos]==0x0E4C && CT_ABV1(t3)) ) // 9.
141*b1cdbd2cSJim Jagielski             Text = Text.replaceAt(nStartPos-1, 1, OUString(inputChar));
142*b1cdbd2cSJim Jagielski         else
143*b1cdbd2cSJim Jagielski             nStartPos=Text.getLength();
144*b1cdbd2cSJim Jagielski     } else
145*b1cdbd2cSJim Jagielski         nStartPos=Text.getLength();
146*b1cdbd2cSJim Jagielski 
147*b1cdbd2cSJim Jagielski     return nStartPos;
148*b1cdbd2cSJim Jagielski }
149*b1cdbd2cSJim Jagielski 
150*b1cdbd2cSJim Jagielski } } } }
151