1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski *
3*b1cdbd2cSJim Jagielski * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski * or more contributor license agreements. See the NOTICE file
5*b1cdbd2cSJim Jagielski * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski * regarding copyright ownership. The ASF licenses this file
7*b1cdbd2cSJim Jagielski * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski * with the License. You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski *
11*b1cdbd2cSJim Jagielski * http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski *
13*b1cdbd2cSJim Jagielski * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski * KIND, either express or implied. See the License for the
17*b1cdbd2cSJim Jagielski * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski * under the License.
19*b1cdbd2cSJim Jagielski *
20*b1cdbd2cSJim Jagielski *************************************************************/
21*b1cdbd2cSJim Jagielski
22*b1cdbd2cSJim Jagielski
23*b1cdbd2cSJim Jagielski
24*b1cdbd2cSJim Jagielski // MARKER(update_precomp.py): autogen include statement, do not remove
25*b1cdbd2cSJim Jagielski #include "precompiled_shell.hxx"
26*b1cdbd2cSJim Jagielski
27*b1cdbd2cSJim Jagielski #ifndef XML_PARSER_HXX_INCLUDED
28*b1cdbd2cSJim Jagielski #include "internal/xml_parser.hxx"
29*b1cdbd2cSJim Jagielski #endif
30*b1cdbd2cSJim Jagielski #include "internal/i_xml_parser_event_handler.hxx"
31*b1cdbd2cSJim Jagielski
32*b1cdbd2cSJim Jagielski #include <assert.h>
33*b1cdbd2cSJim Jagielski
34*b1cdbd2cSJim Jagielski namespace /* private */
35*b1cdbd2cSJim Jagielski {
36*b1cdbd2cSJim Jagielski
37*b1cdbd2cSJim Jagielski //######################################################
38*b1cdbd2cSJim Jagielski /* Extracts the local part of tag without
39*b1cdbd2cSJim Jagielski namespace decoration e.g. meta:creator -> creator */
40*b1cdbd2cSJim Jagielski const XML_Char COLON = (XML_Char)':';
41*b1cdbd2cSJim Jagielski
get_local_name(const XML_Char * rawname)42*b1cdbd2cSJim Jagielski const XML_Char* get_local_name(const XML_Char* rawname)
43*b1cdbd2cSJim Jagielski {
44*b1cdbd2cSJim Jagielski const XML_Char* p = rawname;
45*b1cdbd2cSJim Jagielski
46*b1cdbd2cSJim Jagielski // go to the end
47*b1cdbd2cSJim Jagielski while (*p) p++;
48*b1cdbd2cSJim Jagielski
49*b1cdbd2cSJim Jagielski // go back until the first ':'
50*b1cdbd2cSJim Jagielski while (*p != COLON && p > rawname)
51*b1cdbd2cSJim Jagielski p--;
52*b1cdbd2cSJim Jagielski
53*b1cdbd2cSJim Jagielski // if we are on a colon one step forward
54*b1cdbd2cSJim Jagielski if (*p == COLON)
55*b1cdbd2cSJim Jagielski p++;
56*b1cdbd2cSJim Jagielski
57*b1cdbd2cSJim Jagielski return p;
58*b1cdbd2cSJim Jagielski }
59*b1cdbd2cSJim Jagielski
60*b1cdbd2cSJim Jagielski //################################################
get_parser_instance(void * data)61*b1cdbd2cSJim Jagielski inline xml_parser* get_parser_instance(void* data)
62*b1cdbd2cSJim Jagielski {
63*b1cdbd2cSJim Jagielski return reinterpret_cast<xml_parser*>(XML_GetUserData(
64*b1cdbd2cSJim Jagielski reinterpret_cast<XML_Parser>(data)));
65*b1cdbd2cSJim Jagielski }
66*b1cdbd2cSJim Jagielski
67*b1cdbd2cSJim Jagielski //################################################
has_only_whitespaces(const XML_Char * s,int len)68*b1cdbd2cSJim Jagielski bool has_only_whitespaces(const XML_Char* s, int len)
69*b1cdbd2cSJim Jagielski {
70*b1cdbd2cSJim Jagielski const XML_Char* p = s;
71*b1cdbd2cSJim Jagielski for (int i = 0; i < len; i++)
72*b1cdbd2cSJim Jagielski if (*p++ != ' ') return false;
73*b1cdbd2cSJim Jagielski return true;
74*b1cdbd2cSJim Jagielski }
75*b1cdbd2cSJim Jagielski }
76*b1cdbd2cSJim Jagielski
77*b1cdbd2cSJim Jagielski //###################################################
xml_parser(const XML_Char * EncodingName)78*b1cdbd2cSJim Jagielski xml_parser::xml_parser(const XML_Char* EncodingName) :
79*b1cdbd2cSJim Jagielski document_handler_(0),
80*b1cdbd2cSJim Jagielski xml_parser_(XML_ParserCreate(EncodingName))
81*b1cdbd2cSJim Jagielski {
82*b1cdbd2cSJim Jagielski init();
83*b1cdbd2cSJim Jagielski }
84*b1cdbd2cSJim Jagielski
85*b1cdbd2cSJim Jagielski //###################################################
~xml_parser()86*b1cdbd2cSJim Jagielski xml_parser::~xml_parser()
87*b1cdbd2cSJim Jagielski {
88*b1cdbd2cSJim Jagielski XML_ParserFree(xml_parser_);
89*b1cdbd2cSJim Jagielski }
90*b1cdbd2cSJim Jagielski
91*b1cdbd2cSJim Jagielski //###################################################
92*b1cdbd2cSJim Jagielski /* Callback functions will be called by the parser on
93*b1cdbd2cSJim Jagielski different events */
94*b1cdbd2cSJim Jagielski
95*b1cdbd2cSJim Jagielski //###################################################
96*b1cdbd2cSJim Jagielski extern "C"
97*b1cdbd2cSJim Jagielski {
98*b1cdbd2cSJim Jagielski
xml_start_element_handler(void * UserData,const XML_Char * name,const XML_Char ** atts)99*b1cdbd2cSJim Jagielski static void xml_start_element_handler(void* UserData, const XML_Char* name, const XML_Char** atts)
100*b1cdbd2cSJim Jagielski {
101*b1cdbd2cSJim Jagielski assert(UserData != NULL);
102*b1cdbd2cSJim Jagielski
103*b1cdbd2cSJim Jagielski xml_parser* pImpl = get_parser_instance(UserData);
104*b1cdbd2cSJim Jagielski
105*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
106*b1cdbd2cSJim Jagielski if (pDocHdl)
107*b1cdbd2cSJim Jagielski {
108*b1cdbd2cSJim Jagielski xml_tag_attribute_container_t attributes;
109*b1cdbd2cSJim Jagielski
110*b1cdbd2cSJim Jagielski int i = 0;
111*b1cdbd2cSJim Jagielski
112*b1cdbd2cSJim Jagielski while(atts[i])
113*b1cdbd2cSJim Jagielski {
114*b1cdbd2cSJim Jagielski attributes[reinterpret_cast<const char_t*>(get_local_name(atts[i]))] = reinterpret_cast<const char_t*>(atts[i+1]);
115*b1cdbd2cSJim Jagielski i += 2; // skip to next pair
116*b1cdbd2cSJim Jagielski }
117*b1cdbd2cSJim Jagielski
118*b1cdbd2cSJim Jagielski pDocHdl->start_element(
119*b1cdbd2cSJim Jagielski reinterpret_cast<const char_t*>(name), reinterpret_cast<const char_t*>(get_local_name(name)), attributes);
120*b1cdbd2cSJim Jagielski }
121*b1cdbd2cSJim Jagielski }
122*b1cdbd2cSJim Jagielski
123*b1cdbd2cSJim Jagielski //###################################################
xml_end_element_handler(void * UserData,const XML_Char * name)124*b1cdbd2cSJim Jagielski static void xml_end_element_handler(void* UserData, const XML_Char* name)
125*b1cdbd2cSJim Jagielski {
126*b1cdbd2cSJim Jagielski assert(UserData);
127*b1cdbd2cSJim Jagielski
128*b1cdbd2cSJim Jagielski xml_parser* pImpl = get_parser_instance(UserData);
129*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
130*b1cdbd2cSJim Jagielski if (pDocHdl)
131*b1cdbd2cSJim Jagielski pDocHdl->end_element(reinterpret_cast<const char_t*>(name), reinterpret_cast<const char_t*>(get_local_name(name)));
132*b1cdbd2cSJim Jagielski }
133*b1cdbd2cSJim Jagielski
134*b1cdbd2cSJim Jagielski //###################################################
xml_character_data_handler(void * UserData,const XML_Char * s,int len)135*b1cdbd2cSJim Jagielski static void xml_character_data_handler(void* UserData, const XML_Char* s, int len)
136*b1cdbd2cSJim Jagielski {
137*b1cdbd2cSJim Jagielski assert(UserData);
138*b1cdbd2cSJim Jagielski
139*b1cdbd2cSJim Jagielski xml_parser* pImpl = get_parser_instance(UserData);
140*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
141*b1cdbd2cSJim Jagielski if (pDocHdl)
142*b1cdbd2cSJim Jagielski {
143*b1cdbd2cSJim Jagielski if (has_only_whitespaces(s,len))
144*b1cdbd2cSJim Jagielski pDocHdl->ignore_whitespace(string_t(reinterpret_cast<const char_t*>(s), len));
145*b1cdbd2cSJim Jagielski else
146*b1cdbd2cSJim Jagielski pDocHdl->characters(string_t(reinterpret_cast<const char_t*>(s), len));
147*b1cdbd2cSJim Jagielski }
148*b1cdbd2cSJim Jagielski }
149*b1cdbd2cSJim Jagielski
150*b1cdbd2cSJim Jagielski //###################################################
xml_comment_handler(void * UserData,const XML_Char * Data)151*b1cdbd2cSJim Jagielski static void xml_comment_handler(void* UserData, const XML_Char* Data)
152*b1cdbd2cSJim Jagielski {
153*b1cdbd2cSJim Jagielski assert(UserData);
154*b1cdbd2cSJim Jagielski
155*b1cdbd2cSJim Jagielski xml_parser* pImpl = get_parser_instance(UserData);
156*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* pDocHdl = pImpl->get_document_handler();
157*b1cdbd2cSJim Jagielski if (pDocHdl)
158*b1cdbd2cSJim Jagielski pDocHdl->comment(reinterpret_cast<const char_t*>(Data));
159*b1cdbd2cSJim Jagielski }
160*b1cdbd2cSJim Jagielski
161*b1cdbd2cSJim Jagielski } // extern "C"
162*b1cdbd2cSJim Jagielski
163*b1cdbd2cSJim Jagielski //###################################################
init()164*b1cdbd2cSJim Jagielski void xml_parser::init()
165*b1cdbd2cSJim Jagielski {
166*b1cdbd2cSJim Jagielski XML_SetUserData(xml_parser_, this);
167*b1cdbd2cSJim Jagielski
168*b1cdbd2cSJim Jagielski // we use the parser as handler argument,
169*b1cdbd2cSJim Jagielski // so we could use it if necessary, the
170*b1cdbd2cSJim Jagielski // UserData are usable anyway using
171*b1cdbd2cSJim Jagielski // XML_GetUserData(...)
172*b1cdbd2cSJim Jagielski XML_UseParserAsHandlerArg(xml_parser_);
173*b1cdbd2cSJim Jagielski
174*b1cdbd2cSJim Jagielski XML_SetElementHandler(
175*b1cdbd2cSJim Jagielski xml_parser_,
176*b1cdbd2cSJim Jagielski xml_start_element_handler,
177*b1cdbd2cSJim Jagielski xml_end_element_handler);
178*b1cdbd2cSJim Jagielski
179*b1cdbd2cSJim Jagielski XML_SetCharacterDataHandler(
180*b1cdbd2cSJim Jagielski xml_parser_,
181*b1cdbd2cSJim Jagielski xml_character_data_handler);
182*b1cdbd2cSJim Jagielski
183*b1cdbd2cSJim Jagielski XML_SetCommentHandler(
184*b1cdbd2cSJim Jagielski xml_parser_,
185*b1cdbd2cSJim Jagielski xml_comment_handler);
186*b1cdbd2cSJim Jagielski }
187*b1cdbd2cSJim Jagielski
188*b1cdbd2cSJim Jagielski //###################################################
parse(const char * XmlData,size_t Length,bool IsFinal)189*b1cdbd2cSJim Jagielski void xml_parser::parse(const char* XmlData, size_t Length, bool IsFinal)
190*b1cdbd2cSJim Jagielski {
191*b1cdbd2cSJim Jagielski if (0 == XML_Parse(xml_parser_, XmlData, Length, IsFinal))
192*b1cdbd2cSJim Jagielski throw xml_parser_exception(
193*b1cdbd2cSJim Jagielski (char*)XML_ErrorString(XML_GetErrorCode(xml_parser_)),
194*b1cdbd2cSJim Jagielski (int)XML_GetErrorCode(xml_parser_),
195*b1cdbd2cSJim Jagielski XML_GetCurrentLineNumber(xml_parser_),
196*b1cdbd2cSJim Jagielski XML_GetCurrentColumnNumber(xml_parser_),
197*b1cdbd2cSJim Jagielski XML_GetCurrentByteIndex(xml_parser_));
198*b1cdbd2cSJim Jagielski }
199*b1cdbd2cSJim Jagielski
200*b1cdbd2cSJim Jagielski //###################################################
set_document_handler(i_xml_parser_event_handler * event_handler)201*b1cdbd2cSJim Jagielski void xml_parser::set_document_handler(
202*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* event_handler)
203*b1cdbd2cSJim Jagielski {
204*b1cdbd2cSJim Jagielski document_handler_ = event_handler;
205*b1cdbd2cSJim Jagielski }
206*b1cdbd2cSJim Jagielski
207*b1cdbd2cSJim Jagielski //###################################################
get_document_handler() const208*b1cdbd2cSJim Jagielski i_xml_parser_event_handler* xml_parser::get_document_handler() const
209*b1cdbd2cSJim Jagielski {
210*b1cdbd2cSJim Jagielski return document_handler_;
211*b1cdbd2cSJim Jagielski }
212