xref: /aoo4110/main/shell/source/all/xml_parser.cxx (revision b1cdbd2c)
1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski // MARKER(update_precomp.py): autogen include statement, do not remove
25*b1cdbd2cSJim Jagielski #include "precompiled_shell.hxx"
26*b1cdbd2cSJim Jagielski 
27*b1cdbd2cSJim Jagielski #ifndef XML_PARSER_HXX_INCLUDED
28*b1cdbd2cSJim Jagielski #include "internal/xml_parser.hxx"
29*b1cdbd2cSJim Jagielski #endif
30*b1cdbd2cSJim Jagielski #include "internal/i_xml_parser_event_handler.hxx"
31*b1cdbd2cSJim Jagielski 
32*b1cdbd2cSJim Jagielski #include <assert.h>
33*b1cdbd2cSJim Jagielski 
34*b1cdbd2cSJim Jagielski namespace /* private */
35*b1cdbd2cSJim Jagielski {
36*b1cdbd2cSJim Jagielski 
37*b1cdbd2cSJim Jagielski 	//######################################################
38*b1cdbd2cSJim Jagielski 	/*  Extracts the local part of tag without
39*b1cdbd2cSJim Jagielski 		namespace decoration e.g. meta:creator -> creator */
40*b1cdbd2cSJim Jagielski 	const XML_Char COLON = (XML_Char)':';
41*b1cdbd2cSJim Jagielski 
get_local_name(const XML_Char * rawname)42*b1cdbd2cSJim Jagielski 	const XML_Char* get_local_name(const XML_Char* rawname)
43*b1cdbd2cSJim Jagielski 	{
44*b1cdbd2cSJim Jagielski 		const XML_Char* p = rawname;
45*b1cdbd2cSJim Jagielski 
46*b1cdbd2cSJim Jagielski 		// go to the end
47*b1cdbd2cSJim Jagielski 		while (*p) p++;
48*b1cdbd2cSJim Jagielski 
49*b1cdbd2cSJim Jagielski 		// go back until the first ':'
50*b1cdbd2cSJim Jagielski 		while (*p != COLON && p > rawname)
51*b1cdbd2cSJim Jagielski 			p--;
52*b1cdbd2cSJim Jagielski 
53*b1cdbd2cSJim Jagielski 		// if we are on a colon one step forward
54*b1cdbd2cSJim Jagielski 		if (*p == COLON)
55*b1cdbd2cSJim Jagielski 			p++;
56*b1cdbd2cSJim Jagielski 
57*b1cdbd2cSJim Jagielski 		return p;
58*b1cdbd2cSJim Jagielski 	}
59*b1cdbd2cSJim Jagielski 
60*b1cdbd2cSJim Jagielski 	//################################################
get_parser_instance(void * data)61*b1cdbd2cSJim Jagielski 	inline xml_parser* get_parser_instance(void* data)
62*b1cdbd2cSJim Jagielski 	{
63*b1cdbd2cSJim Jagielski 		return reinterpret_cast<xml_parser*>(XML_GetUserData(
64*b1cdbd2cSJim Jagielski 			reinterpret_cast<XML_Parser>(data)));
65*b1cdbd2cSJim Jagielski 	}
66*b1cdbd2cSJim Jagielski 
67*b1cdbd2cSJim Jagielski     //################################################
has_only_whitespaces(const XML_Char * s,int len)68*b1cdbd2cSJim Jagielski     bool has_only_whitespaces(const XML_Char* s, int len)
69*b1cdbd2cSJim Jagielski     {
70*b1cdbd2cSJim Jagielski         const XML_Char* p = s;
71*b1cdbd2cSJim Jagielski         for (int i = 0; i < len; i++)
72*b1cdbd2cSJim Jagielski             if (*p++ != ' ') return false;
73*b1cdbd2cSJim Jagielski         return true;
74*b1cdbd2cSJim Jagielski     }
75*b1cdbd2cSJim Jagielski }
76*b1cdbd2cSJim Jagielski 
77*b1cdbd2cSJim Jagielski //###################################################
xml_parser(const XML_Char * EncodingName)78*b1cdbd2cSJim Jagielski xml_parser::xml_parser(const XML_Char* EncodingName) :
79*b1cdbd2cSJim Jagielski 	document_handler_(0),
80*b1cdbd2cSJim Jagielski 	xml_parser_(XML_ParserCreate(EncodingName))
81*b1cdbd2cSJim Jagielski {
82*b1cdbd2cSJim Jagielski 	init();
83*b1cdbd2cSJim Jagielski }
84*b1cdbd2cSJim Jagielski 
85*b1cdbd2cSJim Jagielski //###################################################
~xml_parser()86*b1cdbd2cSJim Jagielski xml_parser::~xml_parser()
87*b1cdbd2cSJim Jagielski {
88*b1cdbd2cSJim Jagielski 	XML_ParserFree(xml_parser_);
89*b1cdbd2cSJim Jagielski }
90*b1cdbd2cSJim Jagielski 
91*b1cdbd2cSJim Jagielski //###################################################
92*b1cdbd2cSJim Jagielski /* Callback functions will be called by the parser on
93*b1cdbd2cSJim Jagielski    different events */
94*b1cdbd2cSJim Jagielski 
95*b1cdbd2cSJim Jagielski //###################################################
96*b1cdbd2cSJim Jagielski extern "C"
97*b1cdbd2cSJim Jagielski {
98*b1cdbd2cSJim Jagielski 
xml_start_element_handler(void * UserData,const XML_Char * name,const XML_Char ** atts)99*b1cdbd2cSJim Jagielski static void xml_start_element_handler(void* UserData, const XML_Char* name, const XML_Char** atts)
100*b1cdbd2cSJim Jagielski {
101*b1cdbd2cSJim Jagielski 	assert(UserData != NULL);
102*b1cdbd2cSJim Jagielski 
103*b1cdbd2cSJim Jagielski 	xml_parser* pImpl  = get_parser_instance(UserData);
104*b1cdbd2cSJim Jagielski 
105*b1cdbd2cSJim Jagielski     i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
106*b1cdbd2cSJim Jagielski 	if (pDocHdl)
107*b1cdbd2cSJim Jagielski 	{
108*b1cdbd2cSJim Jagielski 		xml_tag_attribute_container_t attributes;
109*b1cdbd2cSJim Jagielski 
110*b1cdbd2cSJim Jagielski 		int i = 0;
111*b1cdbd2cSJim Jagielski 
112*b1cdbd2cSJim Jagielski 		while(atts[i])
113*b1cdbd2cSJim Jagielski 		{
114*b1cdbd2cSJim Jagielski 			attributes[reinterpret_cast<const char_t*>(get_local_name(atts[i]))] = reinterpret_cast<const char_t*>(atts[i+1]);
115*b1cdbd2cSJim Jagielski 			i += 2; // skip to next pair
116*b1cdbd2cSJim Jagielski 		}
117*b1cdbd2cSJim Jagielski 
118*b1cdbd2cSJim Jagielski 		pDocHdl->start_element(
119*b1cdbd2cSJim Jagielski 			reinterpret_cast<const char_t*>(name), reinterpret_cast<const char_t*>(get_local_name(name)), attributes);
120*b1cdbd2cSJim Jagielski 	}
121*b1cdbd2cSJim Jagielski }
122*b1cdbd2cSJim Jagielski 
123*b1cdbd2cSJim Jagielski //###################################################
xml_end_element_handler(void * UserData,const XML_Char * name)124*b1cdbd2cSJim Jagielski static void xml_end_element_handler(void* UserData, const XML_Char* name)
125*b1cdbd2cSJim Jagielski {
126*b1cdbd2cSJim Jagielski 	assert(UserData);
127*b1cdbd2cSJim Jagielski 
128*b1cdbd2cSJim Jagielski 	xml_parser* pImpl  = get_parser_instance(UserData);
129*b1cdbd2cSJim Jagielski     i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
130*b1cdbd2cSJim Jagielski 	if (pDocHdl)
131*b1cdbd2cSJim Jagielski 		pDocHdl->end_element(reinterpret_cast<const char_t*>(name), reinterpret_cast<const char_t*>(get_local_name(name)));
132*b1cdbd2cSJim Jagielski }
133*b1cdbd2cSJim Jagielski 
134*b1cdbd2cSJim Jagielski //###################################################
xml_character_data_handler(void * UserData,const XML_Char * s,int len)135*b1cdbd2cSJim Jagielski static void xml_character_data_handler(void* UserData, const XML_Char* s, int len)
136*b1cdbd2cSJim Jagielski {
137*b1cdbd2cSJim Jagielski 	assert(UserData);
138*b1cdbd2cSJim Jagielski 
139*b1cdbd2cSJim Jagielski 	xml_parser* pImpl  = get_parser_instance(UserData);
140*b1cdbd2cSJim Jagielski     i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
141*b1cdbd2cSJim Jagielski 	if (pDocHdl)
142*b1cdbd2cSJim Jagielski     {
143*b1cdbd2cSJim Jagielski         if (has_only_whitespaces(s,len))
144*b1cdbd2cSJim Jagielski             pDocHdl->ignore_whitespace(string_t(reinterpret_cast<const char_t*>(s), len));
145*b1cdbd2cSJim Jagielski         else
146*b1cdbd2cSJim Jagielski             pDocHdl->characters(string_t(reinterpret_cast<const char_t*>(s), len));
147*b1cdbd2cSJim Jagielski     }
148*b1cdbd2cSJim Jagielski }
149*b1cdbd2cSJim Jagielski 
150*b1cdbd2cSJim Jagielski //###################################################
xml_comment_handler(void * UserData,const XML_Char * Data)151*b1cdbd2cSJim Jagielski static void xml_comment_handler(void* UserData, const XML_Char* Data)
152*b1cdbd2cSJim Jagielski {
153*b1cdbd2cSJim Jagielski 	assert(UserData);
154*b1cdbd2cSJim Jagielski 
155*b1cdbd2cSJim Jagielski 	xml_parser* pImpl  = get_parser_instance(UserData);
156*b1cdbd2cSJim Jagielski     i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
157*b1cdbd2cSJim Jagielski 	if (pDocHdl)
158*b1cdbd2cSJim Jagielski 		pDocHdl->comment(reinterpret_cast<const char_t*>(Data));
159*b1cdbd2cSJim Jagielski }
160*b1cdbd2cSJim Jagielski 
161*b1cdbd2cSJim Jagielski } // extern "C"
162*b1cdbd2cSJim Jagielski 
163*b1cdbd2cSJim Jagielski //###################################################
init()164*b1cdbd2cSJim Jagielski void xml_parser::init()
165*b1cdbd2cSJim Jagielski {
166*b1cdbd2cSJim Jagielski 	XML_SetUserData(xml_parser_, this);
167*b1cdbd2cSJim Jagielski 
168*b1cdbd2cSJim Jagielski 	// we use the parser as handler argument,
169*b1cdbd2cSJim Jagielski 	// so we could use it if necessary, the
170*b1cdbd2cSJim Jagielski 	// UserData are usable anyway using
171*b1cdbd2cSJim Jagielski 	// XML_GetUserData(...)
172*b1cdbd2cSJim Jagielski 	XML_UseParserAsHandlerArg(xml_parser_);
173*b1cdbd2cSJim Jagielski 
174*b1cdbd2cSJim Jagielski 	XML_SetElementHandler(
175*b1cdbd2cSJim Jagielski 		xml_parser_,
176*b1cdbd2cSJim Jagielski 		xml_start_element_handler,
177*b1cdbd2cSJim Jagielski 		xml_end_element_handler);
178*b1cdbd2cSJim Jagielski 
179*b1cdbd2cSJim Jagielski 	XML_SetCharacterDataHandler(
180*b1cdbd2cSJim Jagielski 		xml_parser_,
181*b1cdbd2cSJim Jagielski 		xml_character_data_handler);
182*b1cdbd2cSJim Jagielski 
183*b1cdbd2cSJim Jagielski 	XML_SetCommentHandler(
184*b1cdbd2cSJim Jagielski 		xml_parser_,
185*b1cdbd2cSJim Jagielski 		xml_comment_handler);
186*b1cdbd2cSJim Jagielski }
187*b1cdbd2cSJim Jagielski 
188*b1cdbd2cSJim Jagielski //###################################################
parse(const char * XmlData,size_t Length,bool IsFinal)189*b1cdbd2cSJim Jagielski void xml_parser::parse(const char* XmlData, size_t Length, bool IsFinal)
190*b1cdbd2cSJim Jagielski {
191*b1cdbd2cSJim Jagielski 	if (0 == XML_Parse(xml_parser_, XmlData, Length, IsFinal))
192*b1cdbd2cSJim Jagielski 		throw xml_parser_exception(
193*b1cdbd2cSJim Jagielski 			(char*)XML_ErrorString(XML_GetErrorCode(xml_parser_)),
194*b1cdbd2cSJim Jagielski 			(int)XML_GetErrorCode(xml_parser_),
195*b1cdbd2cSJim Jagielski 			XML_GetCurrentLineNumber(xml_parser_),
196*b1cdbd2cSJim Jagielski 			XML_GetCurrentColumnNumber(xml_parser_),
197*b1cdbd2cSJim Jagielski 			XML_GetCurrentByteIndex(xml_parser_));
198*b1cdbd2cSJim Jagielski }
199*b1cdbd2cSJim Jagielski 
200*b1cdbd2cSJim Jagielski //###################################################
set_document_handler(i_xml_parser_event_handler * event_handler)201*b1cdbd2cSJim Jagielski void xml_parser::set_document_handler(
202*b1cdbd2cSJim Jagielski 	i_xml_parser_event_handler* event_handler)
203*b1cdbd2cSJim Jagielski {
204*b1cdbd2cSJim Jagielski 	document_handler_ = event_handler;
205*b1cdbd2cSJim Jagielski }
206*b1cdbd2cSJim Jagielski 
207*b1cdbd2cSJim Jagielski //###################################################
get_document_handler() const208*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* xml_parser::get_document_handler() const
209*b1cdbd2cSJim Jagielski {
210*b1cdbd2cSJim Jagielski 	return document_handler_;
211*b1cdbd2cSJim Jagielski }
212