htmllib
 

HTML 2.0 parser.

See the HTML 2.0 specification:
http://www.w3.org/hypertext/WWW/MarkUp/html-spec/html-spec_toc.html


 Modules
                                                                                                                                                                                                                               
string
sys


 Classes
                                                                                                                                                                                                                               
sgmllib.SGMLParser
HTMLParser


 class HTMLParser(sgmllib.SGMLParser)
           no doc string
                                                                                                                                                                                                                     
__init__(self, formatter, verbose=0)
no doc string
anchor_bgn(self, href, name, type)
# --- Hooks for anchors; should probably be overridden
anchor_end(self)
no doc string
ddpop(self, bl=0)
no doc string
do_base(self, attrs)
no doc string
do_br(self, attrs)
# --- Line Break
do_dd(self, attrs)
no doc string
do_dt(self, attrs)
no doc string
do_hr(self, attrs)
# --- Horizontal Rule
do_img(self, attrs)
# --- Image
do_isindex(self, attrs)
no doc string
do_li(self, attrs)
no doc string
do_link(self, attrs)
no doc string
do_meta(self, attrs)
no doc string
do_nextid(self, attrs)
no doc string
do_p(self, attrs)
# --- Block Structuring Elements
do_plaintext(self, attrs)
# --- Really Old Unofficial Deprecated Stuff
end_a(self)
no doc string
end_address(self)
no doc string
end_b(self)
no doc string
end_blockquote(self)
no doc string
end_body(self)
no doc string
end_cite(self)
no doc string
end_code(self)
no doc string
end_dir(self)
no doc string
end_dl(self)
no doc string
end_em(self)
no doc string
end_h1(self)
no doc string
end_h2(self)
no doc string
end_h3(self)
no doc string
end_h4(self)
no doc string
end_h5(self)
no doc string
end_h6(self)
no doc string
end_head(self)
no doc string
end_html(self)
no doc string
end_i(self)
no doc string
end_kbd(self)
no doc string
end_listing(self)
no doc string
end_menu(self)
no doc string
end_ol(self)
no doc string
end_pre(self)
no doc string
end_samp(self)
no doc string
end_strong(self)
no doc string
end_title(self)
no doc string
end_tt(self)
no doc string
end_ul(self)
no doc string
end_var(self)
no doc string
end_xmp(self)
no doc string
handle_data(self, data)
# --- Formatter interface, taking care of 'savedata' mode;
# shouldn't need to be overridden
handle_image(self, src, alt, *args)
# --- Hook for images; should probably be overridden
save_bgn(self)
# --- Hooks to save data; shouldn't need to be overridden
save_end(self)
no doc string
start_a(self, attrs)
no doc string
start_address(self, attrs)
no doc string
start_b(self, attrs)
no doc string
start_blockquote(self, attrs)
no doc string
start_body(self, attrs)
no doc string
start_cite(self, attrs)
no doc string
start_code(self, attrs)
no doc string
start_dir(self, attrs)
no doc string
start_dl(self, attrs)
no doc string
start_em(self, attrs)
no doc string
start_h1(self, attrs)
# --- Headings
start_h2(self, attrs)
no doc string
start_h3(self, attrs)
no doc string
start_h4(self, attrs)
no doc string
start_h5(self, attrs)
no doc string
start_h6(self, attrs)
no doc string
start_head(self, attrs)
no doc string
start_html(self, attrs)
no doc string
start_i(self, attrs)
# Typographic Elements
start_kbd(self, attrs)
no doc string
start_listing(self, attrs)
no doc string
start_menu(self, attrs)
no doc string
start_ol(self, attrs)
no doc string
start_pre(self, attrs)
no doc string
start_samp(self, attrs)
no doc string
start_strong(self, attrs)
no doc string
start_title(self, attrs)
# ------ Head elements
start_tt(self, attrs)
no doc string
start_ul(self, attrs)
# --- List Elements
start_var(self, attrs)
no doc string
start_xmp(self, attrs)
no doc string
unknown_endtag(self, tag)
no doc string
unknown_starttag(self, tag, attrs)
# --- Unhandled tags


 Functions
                                                                                                                                                                                                                               
test(args=None)
no doc string