use rich text for text fields (via ckeditor); convert spip to html

author Frédéric Péters <fpeters@0d.be>

Sun, 7 Apr 2013 16:15:57 +0000 (18:15 +0200)

committer Frédéric Péters <fpeters@0d.be>

Sun, 7 Apr 2013 16:15:57 +0000 (18:15 +0200)
author Frédéric Péters <fpeters@0d.be>
Sun, 7 Apr 2013 16:15:57 +0000 (18:15 +0200)
committer Frédéric Péters <fpeters@0d.be>
Sun, 7 Apr 2013 16:15:57 +0000 (18:15 +0200)
diff --git a/panikdb/emissions/management/commands/_spip2html.py b/panikdb/emissions/management/commands/_spip2html.py

new file mode 100644 (file)

index 0000000..25280a9
--- /dev/null
+++ b/panikdb/emissions/management/commands/_spip2html.py
@@ -0,0 +1,1049 @@
+# -*- coding: utf-8 -*-
+#
+# Code scavenged from Glasnost
+# By: Odile Bénassy <obenassy@entrouvert.com>
+#     Romain Chantereau <rchantereau@entrouvert.com>
+#     Nicolas Clapiès <nclapies@easter-eggs.org>
+#     Pierre-Antoine Dejace <padejace@entrouvert.be>
+#     Thierry Dulieu <tdulieu@easter-eggs.com>
+#     Florent Monnier <monnier@codelutin.com>
+#     Cédric Musso <cmusso@easter-eggs.org>
+#     Frédéric Péters <fpeters@entrouvert.be>
+#     Benjamin Poussin <poussin@codelutin.com>
+#     Emmanuel Raviart <eraviart@entrouvert.com>
+#     Sébastien Régnier <regnier@codelutin.com>
+#     Emmanuel Saracco <esaracco@easter-eggs.com>
+#
+# Copyright (C) 2000, 2001 Easter-eggs & Emmanuel Raviart
+# Copyright (C) 2002 Odile Bénassy, Code Lutin, Thierry Dulieu, Easter-eggs,
+#     Entr'ouvert, Frédéric Péters, Benjamin Poussin, Emmanuel Raviart,
+#     Emmanuel Saracco & Théridion
+# Copyright (C) 2003 Odile Bénassy, Romain Chantereau, Nicolas Clapiès,
+#     Code Lutin, Pierre-Antoine Dejace, Thierry Dulieu, Easter-eggs,
+#     Entr'ouvert, Florent Monnier, Cédric Musso, Ouvaton, Frédéric Péters,
+#     Benjamin Poussin, Rodolphe Quiédeville, Emmanuel Raviart, Sébastien
+#     Régnier, Emmanuel Saracco, Théridion & Vecam
+#
+# This program is free software; you can redistribute it and/or
+# modify it under the terms of the GNU General Public License
+# as published by the Free Software Foundation; either version 2
+# of the License, or (at your option) any later version.
+#
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+# GNU General Public License for more details.
+#
+# You should have received a copy of the GNU General Public License
+# along with this program; if not, write to the Free Software
+# Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
+
+import re
+import sys
+
+_non_id_chars = re.compile('[^a-z0-9]+')
+_non_id_at_ends = re.compile('^[-0-9]+|-+$')
+
+def enhanceTypo(s):
+    # typographic junkie
+    #   idea from: http://daringfireball.net/projects/smartypants/
+    s = s.replace('...', '&#8230;')   # ellipsis (...)
+    s = s.replace(' -- ', ' &#8212; ')  # em-dash
+    s = s.replace('(c)', '&copy; ')  # copyright symbol
+    return s
+
+
+def parseSpipLink(link):
+    link = link.replace('\n', ' ')
+    matchObject = re.match(
+            r'(?P<role>alias|art(icle)?|atom|book|card|election|file|'\
+             'grade|group|heading|im(g|age)?|person(ne)?|rubri(c|que)'\
+             ') *(?P<localId>\S+) *(?P<option>\S+)?', link)
+
+    if matchObject is None:
+        name = link
+        for prefix in [ 'http://', 'https://', 'ftp://', 'mailto:' ]:
+            if name.startswith(prefix):
+                if not '/' in name[len(prefix):]:
+                    name = name[len(prefix):]
+                break
+        else:
+            name = ''
+        return name, link
+
+    role = matchObject.group('role')
+    localId = matchObject.group('localId')
+    option = matchObject.group('option') and \
+            ':%s' % matchObject.group('option') or ''
+
+    return ('XXX', '#')
+
+
+class Formatter:
+    def close(self, **keywords):
+        return ''
+
+    def list(self, list):
+        def getListIndent(stack):
+            if len(stack) == 0:
+                return -1
+            else:
+                return stack[-1][0]
+        stack = []
+        result = ''
+        for line in list:
+            indent, type, text = line
+            while indent < getListIndent(stack):
+                result += self.listEnd(len(stack), stack[-1][1])
+                del stack[-1]
+            if indent > getListIndent(stack):
+                stack.append((indent, type))
+                result += self.listBegin(len(stack) - 1, type)
+            result += self.listItem(len(stack), text)
+        while stack:
+            result += self.listEnd(len(stack) - 1, stack[-1][1])
+            del stack[-1]
+        return result
+
+    def open(self, **keywords):
+        return ''
+
+    def prescaleImage(self):
+        return 1
+
+    def table(self, table, hasHeader):
+        result = ''
+        rows = len(table)
+        cols = max(map(len, table))
+        result += self.tableBegin(rows, cols)
+        for i in range(len(table)):
+            row = table[i]
+            rowNumber = i
+            if hasHeader:
+                rowNumber -= 1
+            result += self.tableLineBegin(rowNumber,
+                                          isHeader = i == 0 and hasHeader)
+            j = 0
+            for cell in row:
+                if type(cell) in (str, unicode) and cell.strip() == '###':
+                    cell = rowNumber + 1
+                result += self.tableCell(cell, rowNumber, j,
+                                         isHeader = i == 0 and hasHeader)
+                j += 1
+            result += self.tableLineEnd(i, isHeader = i == 0 and hasHeader)
+        result += self.tableEnd(isHeader = len(table) == 1 and hasHeader)
+        return result
+
+    def text(self, text):
+        return text
+
+
+class FormatterHtml(Formatter):
+    def __init__(self):
+        self.states = [ '' ]
+
+    def intertitle(self, text, sublevel = 0):
+        nameText = re.sub('<.*?>', '', text).strip()
+        # from docutils/nodes.py, def make_id(string)
+        nameText = _non_id_chars.sub('-', ' '.join(nameText.lower().split()))
+        nameText = _non_id_at_ends.sub('', nameText)
+
+        return '<h%(sectionLevel)d id="%(nameText)s">%(text)s'\
+               '</h%(sectionLevel)d>\n\n' % {
+            'text': text.strip(),
+            'sectionLevel': self.sectionLevel + sublevel,
+            'nameText': nameText,
+            }
+
+    def lineBreak(self):
+        return '<br />\n'
+
+    def list(self, list):
+        # FIXME: the Formatter.list method doesn't work for sub-lists, so it is
+        # rewritten here. Maybe this method should also be used by
+        # Formatter.list
+        def getListIndent(stack):
+            if len(stack) == 0:
+                return -1
+            else:
+                return stack[-1][0]
+        self.states.append('blockLevel')
+        stack = []
+        result = ''
+        for line in list:
+            indent, type, text = line
+            while indent < getListIndent(stack):
+                result += self.listItemEnd()
+                result += self.listEnd(len(stack), stack[-1][1])
+                del stack[-1]
+            if indent > getListIndent(stack):
+                stack.append((indent, type))
+                result += '\n'
+                result += self.listBegin(len(stack) - 1, type)
+            else:
+                result += self.listItemEnd()
+            result += self.listItemBegin(len(stack), text)
+        while stack:
+            result += self.listItemEnd()
+            result += self.listEnd(len(stack) - 1, stack[-1][1])
+            del stack[-1]
+        return result
+
+    def listBegin(self, indent, type):
+        if type:
+            type = 'ol'
+        else:
+            type = 'ul'
+        return '%(indent)s<%(type)s>\n' % {
+            'indent': '  ' * indent,
+            'type': type,
+            }
+
+    def listEnd(self, indent, type):
+        if type:
+            type = 'ol'
+        else:
+            type = 'ul'
+        return '%(indent)s</%(type)s>\n' % {
+            'indent': '  ' * indent,
+            'type': type,
+            }
+
+    def listItemBegin(self, indent, item):
+        return '%(indent)s<li>%(item)s' % {
+            'indent': '  ' * indent,
+            'item': item.strip('*'),
+            }
+
+    def listItemEnd(self):
+        return '</li>\n'
+
+    def nonBreakingSpace(self):
+        return '&nbsp;'
+
+    def open(self, **keywords):
+        self.sectionLevel = 2
+        if keywords.has_key('sectionLevel'):
+            self.sectionLevel = int(keywords['sectionLevel'])
+        return ''
+
+    def paragraph(self, text):
+        if self.states[-1] == 'blockLevel':
+            self.states.pop()
+            return text
+
+
+        def line80(text):
+            t = []
+            i = 0
+            while 1:
+                val = text[i+70:].find(' ')
+                if val == -1:
+                    t.append(text[i:])
+                    break
+                part = text[i:i+70+val+1]
+                t.append(part)
+                i += len(part)
+            return '\n'.join(t)
+
+        text = enhanceTypo(text.strip())
+        text = line80(text.replace('\n', ' '))
+        text = text.replace('\n_ ', '\n<br/>\n')
+        if not text:
+            return self.lineBreak()
+        return '<p>%(text)s</p>\n\n' % {
+            'text': text,
+            }
+
+    def preformatted(self, text):
+        if not text:
+            return ''
+##         text = self.text(text)
+        self.states.append('blockLevel')
+        return '<pre>%(text)s</pre>' % {
+            'text': text,
+            }
+
+    def preformattedInline(self, text):
+        if not text:
+            return ''
+        text = self.text(text)
+        return '<code>%(text)s</code>' % {
+            'text': text,
+            }
+
+    def punctuationAndSpace(self, punctuation):
+        return {
+            u'« ': u'«&nbsp;',
+            }[punctuation]
+
+    def spaceAndPunctuation(self, punctuation):
+        return {
+            u' :': u'&nbsp;:',
+            u' ;': u'&nbsp;;',
+            u' !': u'&nbsp;!',
+            u' ?': u'&nbsp;?',
+            u' »': u'&nbsp;»',
+            u' %': u'&nbsp;%',
+            u' ...': u'&nbsp;...',
+            }[punctuation]
+
+    def tableBegin(self, rows, cols):
+        self.states.append('blockLevel')
+        return '<table>\n'
+
+    def tableCell(self, cell, row, col, isHeader):
+        if not cell:
+            cell = '&nbsp;'
+        if isHeader:
+            tag = 'th'
+            attrtag = ' scope="col"'
+        else:
+            tag = 'td'
+            attrtag = ''
+        return '    <%(tag)s%(attrtag)s>%(cell)s</%(tag)s>\n' % {
+            'tag': tag,
+            'cell': cell.strip(),
+            'attrtag': attrtag,
+            }
+
+    def tableEnd(self, isHeader = 0):
+        return '</table>\n'
+
+    def tableLineBegin(self, tableLineCount, isHeader = 0):
+        if isHeader:
+            return '  <tr>\n'
+        elif (tableLineCount + 1) % 2 == 0:
+            return '  <tr class="even">\n'
+        else:
+            return '  <tr class="odd">\n'
+
+    def tableLineEnd(self, tableLineCount, isHeader = 0):
+        return '  </tr>\n'
+
+    def text(self, text):
+        if not text:
+            return ''
+        text = text.replace('&', '&amp;')
+        text = text.replace('<', '&lt;')
+        #text = text.replace('\x85', '&#8230;')  # ellipsis (...)
+        return text
+
+
+class FormatterHtmlComplete(FormatterHtml):
+    _footNotes = None
+
+    def close(self, **keywords):
+        footNotes = self._footNotes
+        if footNotes is None or len(footNotes) == 0:
+            return ''
+        indexes = footNotes.keys()
+        indexes.sort()
+        result = '<div class="spip-notes">\n'
+        for index in indexes:
+            result += '<p>'
+            result += '[<a href="#nh%(index)s" name="nb%(index)s" '\
+                      'class="spip-note">%(index)s</a>]&nbsp;%(text)s' % {
+                'index': index,
+                'text': footNotes[index],
+                }
+            result += '</p>\n'
+        result += '</div>\n'
+        return result
+
+    def emphasis(self, text):
+        if not text:
+            return ''
+        return '<em>%(text)s</em>' % {
+            'text': text,
+            }
+
+    def footNoteCall(self, footNote):
+        if self._footNotes is None:
+            self._footNotes = {}
+        index = len(self._footNotes) + 1
+        self._footNotes[index] = footNote
+        return '&nbsp;[<a href="#nb%(index)s" name="nh%(index)s" '\
+                'class="spip-note">%(index)s</a>]' % { 'index': index }
+
+    def image(self, name, url, width = None, height = None, fullUrl = None):
+        if width:
+            width = ' width="%s"' % width
+        else:
+            width = ''
+        if height:
+            height = ' height="%s"' % height
+        else:
+            height = ''
+        image = """\
+<img src="%(url)s" alt="%(name)s" title="%(name)s"%(height)s%(width)s />\
+""" % {
+            'height': height,
+            'name': name,
+            'url': url,
+            'width': width,
+            }
+        if fullUrl:
+            image = '<a href="%(fullUrl)s">%(image)s</a>' % {
+                'fullUrl': fullUrl,
+                'image': image,
+                }
+        return image
+
+    def lineSeparator(self):
+        return '<hr />\n'
+
+    def link(self, name, url, title=None):
+        url = url.replace('"', '&quot;') # '"' must be converted.
+        # The following replace should not be done. An url must be left as is.
+        # url = url.replace('&', '&amp;') #
+        # url = url.replace('<', '&lt;') # ?
+        # url = url.replace('>', '&gt;') # ?
+        attrs = ['href="%s"' % url]
+        if title:
+            attrs.append('title="%s"' % title)
+        if url.startswith('http://'):
+            attrs.append('class="external"')
+        attrs = ' '.join(attrs)
+        return '<a %s>%s</a>' % (attrs, name)
+
+    def strong(self, text):
+        if not text:
+            return ''
+        return '<strong>%(text)s</strong>' % {
+            'text': text,
+            }
+
+    def teletype(self, text):
+        if not text:
+            return ''
+        return '<tt>%(text)s</tt>' % {
+            'text': text,
+            }
+
+
+class FormatterHtmlSimple(FormatterHtml):
+    def emphasis(self, text):
+        return text
+
+    def footNoteCall(self, footNote):
+        return ''
+
+    def image(self, name, url, width = None, height = None, fullUrl = None):
+        return ''
+
+    def lineSeparator(self):
+        return '<br />\n'
+
+    def link(self, name, url, title=None):
+        return str(name)
+
+    def strong(self, text):
+        return text
+
+    def teletype(self, text):
+        return text
+
+
+
+class SpipParser:
+    codeRegexp = r"""
+(?P<codeStop>\</(code|CODE)\>)
+|(?P<wordAsIs>\w+)
+"""
+    codeRegexp = codeRegexp.replace('\n', '')
+    codeRegexpObject = None
+    footNoteRegexp = r"""
+(?P<footNoteStop>\]\])
+|(?P<image>\<((im(g|age)?)|(IM(G|AGE)?)) *(\d+|[^ \>]+)( +\d+\*\d+)?\>)
+|(?P<teletypeStart>\(\()
+|(?P<teletypeStop>\)\))
+|(?P<strongStart>\{\{)
+|(?P<strongStop>\}\})
+|(?P<emphasisStart>\{)
+|(?P<emphasisStop>\})
+|(?P<linkStart>\[)
+|(?P<antislash>\\.?)
+|(?P<punctuationAndSpace>[«] )
+|(?P<spaceAndPunctuation> ([:;!\?»%]|\.\.\.))
+|(?P<nonBreakingSpace>~)
+|(?P<word>\w+)
+"""
+    footNoteRegexp = footNoteRegexp.replace('\n', '')
+    footNoteRegexpObject = None
+    linkNameRegexp = r"""
+(?P<image>\<((im(g|age)?)|(IM(G|AGE)?)) *(\d+|[^ \>]+)( +\d+\*\d+)?\>)
+|(?P<teletypeStart>\(\()
+|(?P<teletypeStop>\)\))
+|(?P<strongStart>\{\{)
+|(?P<strongStop>\}\})
+|(?P<emphasisStart>\{)
+|(?P<emphasisStop>\})
+|(?P<linkMiddle>->)
+|(?P<linkWithoutMiddleStop>\])
+|(?P<antislash>\\.?)
+|(?P<punctuationAndSpace>[«] )
+|(?P<spaceAndPunctuation> ([:;!\?»%]|\.\.\.))
+|(?P<nonBreakingSpace>~)
+|(?P<word>\w+)
+"""
+    linkNameRegexp = linkNameRegexp.replace('\n', '')
+    linkNameRegexpObject = None
+    linkRegexp = r"""
+(?P<linkStop>\])
+|(?P<wordInUrl>\w+)
+"""
+    linkRegexp = linkRegexp.replace('\n', '')
+    linkRegexpObject = None
+    listRegexp = r"""
+(?P<listLineStart>^ *-([0-9aAiI]\.)?(?=[^-]))
+|(?P<listLineStop>\r?\n(?= *-([0-9aAiI]\.)?(?=[^-])))
+|(?P<listLineContinuation>\r?\n(?= +))
+|(?P<listStop>(?=\r?\n|$))
+|(?P<image>\<((im(g|age)?)|(IM(G|AGE)?)) *(\d+|[^ \>]+)( +\d+\*\d+)?\>)
+|(?P<teletypeStart>\(\()
+|(?P<teletypeStop>\)\))
+|(?P<strongStart>\{\{)
+|(?P<strongStop>\}\})
+|(?P<emphasisStart>\{)
+|(?P<emphasisStop>\})
+|(?P<footNoteStart>\[\[)
+|(?P<linkStart>\[)
+|(?P<antislash>\\.?)
+|(?P<punctuationAndSpace>[«] )
+|(?P<spaceAndPunctuation> ([:;!\?»%]|\.\.\.))
+|(?P<nonBreakingSpace>~)
+|(?P<word>\w+)
+"""
+    listRegexp = listRegexp.replace('\n', '')
+    listRegexpObject = None
+    paragraphRegexp = r"""
+(?P<paragraphStop>\r?\n( *\r?\n)* *(?=\r?\n|$))
+|(?P<lineSeparator>^ *[-_]{4,} *(\r?\n|$))
+|(?P<intertitleStart>^ *\{\{\{)
+|(?P<intertitleStop>\}\}\}( *$|))
+|(?P<listStart>^ *-([0-9aAiI]\.)?)
+|(?P<tableWithHeaderStart>^ *\|(?=( *\{\{.*?\}\} *\|)+ *(\r?\n|$)))
+|(?P<tableStart>^ *\|)
+|(?P<codeStart>\<(code|CODE)\>)
+|(?P<image>\<((im(g|age)?)|(IM(G|AGE)?)) *(\d+|[^ \>]+)( +\d+\*\d+)?\>)
+|(?P<teletypeStart>\(\()
+|(?P<teletypeStop>\)\))
+|(?P<strongStart>\{\{)
+|(?P<strongStop>\}\})
+|(?P<emphasisStart>\{)
+|(?P<emphasisStop>\})
+|(?P<footNoteStart>\[\[)
+|(?P<linkStart>\[)
+|(?P<antislash>\\.?)
+|(?P<punctuationAndSpace>[«] )
+|(?P<spaceAndPunctuation> ([:;!\?»%]|\.\.\.))
+|(?P<nonBreakingSpace>~)
+|(?P<word>\w+)
+"""
+    paragraphRegexp = paragraphRegexp.replace('\n', '')
+    paragraphRegexpObject = None
+    posDelta = 0
+    spipRegexp = r"""
+(?P<paragraphStart>\r?\n)
+"""
+    spipRegexp = spipRegexp.replace('\n', '')
+    spipRegexpObject = None
+    states = None
+    tableRegexp = r"""
+(?P<rowStart>^ *\|)
+|(?P<rowStop>\| *\r?\n(?= *\|))
+|(?P<tableStop>\| *(?=\r?\n|$))
+|(?P<cellRestart>\|)
+|(?P<image>\<((im(g|age)?)|(IM(G|AGE)?)) *(\d+|[^ \>]+)( +\d+\*\d+)?\>)
+|(?P<teletypeStart>\(\()
+|(?P<teletypeStop>\)\))
+|(?P<strongStart>\{\{)
+|(?P<strongStop>\}\})
+|(?P<emphasisStart>\{)
+|(?P<emphasisStop>\})
+|(?P<footNoteStart>\[\[)
+|(?P<linkStart>\[)
+|(?P<antislash>\\.?)
+|(?P<punctuationAndSpace>[«] )
+|(?P<spaceAndPunctuation> ([:;!\?»%]|\.\.\.))
+|(?P<nonBreakingSpace>~)
+|(?P<word>\w+)
+"""
+    tableRegexp = tableRegexp.replace('\n', '')
+    tableRegexpObject = None
+
+    def __init__(self):
+        self.codeRegexpObject = re.compile(self.codeRegexp,
+                                           re.MULTILINE | re.DOTALL)
+        self.footNoteRegexpObject = re.compile(self.footNoteRegexp,
+                                               re.MULTILINE | re.DOTALL)
+        self.linkNameRegexpObject = re.compile(self.linkNameRegexp,
+                                               re.MULTILINE | re.DOTALL)
+        self.linkRegexpObject = re.compile(self.linkRegexp,
+                                           re.MULTILINE | re.DOTALL)
+        self.listRegexpObject = re.compile(self.listRegexp,
+                                           re.MULTILINE | re.DOTALL)
+        self.paragraphRegexpObject = re.compile(self.paragraphRegexp,
+                                                re.MULTILINE | re.DOTALL)
+        self.spipRegexpObject = re.compile(self.spipRegexp,
+                                           re.MULTILINE | re.DOTALL)
+        self.tableRegexpObject = re.compile(self.tableRegexp,
+                                            re.MULTILINE | re.DOTALL)
+        self.states = []
+        self.pushState({
+            'state': None,
+            })
+        self.pushState({
+            'formattedText': '',
+            'paragraphsCount': 0,
+            'regexpObject': self.spipRegexpObject,
+            'state': 'spip',
+            })
+        self.pushState({
+            'formattedText': '',
+            'ignoreEmptyParagraph': 0,
+            'regexpObject': self.paragraphRegexpObject,
+            'state': 'paragraph',
+            })
+
+    def format(self, formatter, rawText, **keywords):
+        self.formatter = formatter
+        formattedText = self.formatter.open(**keywords)
+        if not rawText:
+            rawText = ''
+        rawText = rawText.expandtabs()
+        pos = 0
+        while pos < len(rawText):
+            regexpObject = self.getVar('regexpObject')
+            matchObject = regexpObject.match(rawText, pos)
+            if matchObject is None or matchObject.lastgroup is None:
+                self.setVar(
+                    'formattedText',
+                    self.getVar('formattedText') \
+                    + self.formatter.text(rawText[pos]))
+                pos += 1
+            else:
+                groupName = matchObject.lastgroup
+                result = apply(getattr(self, 'handle_' + groupName),
+                               (matchObject.group(groupName), ))
+                if result:
+                    self.setVar('formattedText',
+                                self.getVar('formattedText') + result)
+                pos = matchObject.end(groupName) + self.posDelta
+                if self.posDelta != 0:
+                    del self.posDelta
+        while len(self.states) > 2:
+            if self.getVar('state') == 'list':
+                result = self.handle_listStop(None)
+                if result:
+                    self.setVar('formattedText',
+                                self.getVar('formattedText') + result)
+            elif self.getVar('state') == 'paragraph':
+                result = self.handle_paragraphStop(None, isLastParagraph = 1)
+                if result:
+                    self.setVar('formattedText',
+                                self.getVar('formattedText') + result)
+            else:
+                self.pullState()
+        formattedText += self.getVar('formattedText')
+        formattedText = formattedText.strip() + '\n'
+        formattedText += self.formatter.close(**keywords)
+        return formattedText
+
+    def getVar(self, name):
+        for state in self.states:
+            if state.has_key(name):
+                return state[name]
+        else:
+            raise KeyError(name)
+
+    def getPreviousVar(self, name):
+        for state in self.states[1:]:
+            if state.has_key(name):
+                return state[name]
+        else:
+            raise KeyError(name)
+
+    def handle_antislash(self, group):
+        character = group[1]
+        if character == 'n':
+            return self.formatter.lineBreak()
+        else:
+            return self.formatter.text(character)
+
+    def handle_cellRestart(self, group):
+        self.handle_cellStop(group)
+        self.handle_cellStart(group)
+        return None
+
+    def handle_cellStart(self, group):
+        table = self.getVar('table')
+        table[-1].append([])
+        return None
+
+    def handle_cellStop(self, group):
+        table = self.getVar('table')
+        table[-1][-1] = self.getVar('formattedText')
+        self.setVar('formattedText', '')
+        return None
+
+    def handle_codeStart(self, group):
+        self.pushState({
+            'formattedText': '',
+            'regexpObject': self.codeRegexpObject,
+            'state': 'code',
+            })
+        return None
+
+    def handle_codeStop(self, group):
+        if self.getVar('state') != 'code':
+            return None
+        formattedText = self.getVar('formattedText')
+        self.pullState()
+        return self.formatter.preformatted(formattedText)
+
+    def handle_emphasisStart(self, group):
+        self.pushState({
+            'formattedText': '',
+            'state': 'emphasis',
+            })
+        return None
+
+    def handle_emphasisStop(self, group):
+        if self.getVar('state') != 'emphasis':
+            return None
+        formattedText = self.getVar('formattedText')
+        self.pullState()
+        return self.formatter.emphasis(formattedText)
+
+    def handle_footNoteStart(self, group):
+        self.pushState({
+            'formattedText': '',
+            'regexpObject': self.footNoteRegexpObject,
+            'state': 'footNote',
+            })
+        return None
+
+    def handle_footNoteStop(self, group):
+        if self.getVar('state') != 'footNote':
+            return None
+        formattedText = self.getVar('formattedText')
+        self.pullState()
+        return self.formatter.footNoteCall(formattedText)
+
+    def handle_image(self, group):
+        matchObject = re.match(
+                r'\<((im(g|age)?)|(IM(G|AGE)?)) '\
+                 '*((?P<localId>\d+)|(?P<url>[^ \>]+))'\
+                 '( +(?P<width>\d+)\*(?P<height>\d+))?\>', group)
+        localId = matchObject.group('localId')
+        url = matchObject.group('url')
+        width = matchObject.group('width')
+        height = matchObject.group('height')
+        name = localId
+        if url:
+            url = '#' + url
+        else:
+            url = '#'
+        fullUrl = '#'
+        return self.formatter.image(name, url, width, height, fullUrl)
+
+    def handle_intertitleStart(self, group):
+        inParagraph = self.getVar('state') == 'paragraph'
+        if inParagraph:
+            result = self.handle_paragraphStop(None, ignoreEmptyParagraph = 1)
+            if result:
+                self.setVar('formattedText',
+                            self.getVar('formattedText') + result)
+        self.pushState({
+            'formattedText': '',
+            'inParagraph': inParagraph,
+            'regexpObject': self.paragraphRegexpObject,
+            'state': 'intertitle',
+            })
+        return None
+
+    def handle_intertitleStop(self, group):
+        if self.getVar('state') == 'intertitle':
+            formattedText = self.getVar('formattedText')
+            inParagraph = self.getVar('inParagraph')
+            self.pullState()
+            formattedText = self.formatter.intertitle(formattedText)
+            self.setVar('formattedText',
+                        self.getVar('formattedText') + formattedText)
+            if inParagraph:
+                return self.handle_paragraphStart(None,
+                                                  ignoreEmptyParagraph = 1)
+            else:
+                return None
+        elif self.getVar('state') == 'strong':
+            self.posDelta -= 1
+            return self.handle_strongStop(group[:-1])
+        elif self.getVar('state') == 'emphasis':
+            self.posDelta -= 2
+            return self.handle_emphasisStop(group[:-2])
+        else:
+            return None
+
+    def handle_lineSeparator(self, group):
+        inParagraph = self.getVar('state') == 'paragraph'
+        if inParagraph:
+            result = self.handle_paragraphStop(None, ignoreEmptyParagraph = 1)
+            if result:
+                self.setVar('formattedText',
+                            self.getVar('formattedText') + result)
+        formattedText = self.formatter.lineSeparator()
+        self.setVar('formattedText',
+                    self.getVar('formattedText') + formattedText)
+        if inParagraph:
+            return self.handle_paragraphStart(None, ignoreEmptyParagraph = 1)
+        else:
+            return None
+
+    def handle_linkMiddle(self, group):
+        if self.getVar('state') != 'linkName':
+            return None
+        name = self.getVar('formattedText')
+        self.pullState()
+        self.pushState({
+            'formattedText': '',
+            'name': name,
+            'regexpObject': self.linkRegexpObject,
+            'state': 'link',
+            })
+        return None
+
+    def handle_linkStart(self, group):
+        self.pushState({
+            'formattedText': '',
+            'regexpObject': self.linkNameRegexpObject,
+            'state': 'linkName',
+            })
+        return None
+
+    def handle_linkStop(self, group):
+        if self.getVar('state') != 'link':
+            return None
+        title = None
+        name = self.getVar('name')
+        link = self.getVar('formattedText')
+        self.pullState()
+        link = link.strip()
+        title, url = parseSpipLink(link)
+        if not title:
+            title = url
+        if name and '|' in name:
+            oTitle = title
+            try:
+                name, title = name.split('|', 2)
+            except ValueError:
+                # XXX
+                print 'error splitting', repr(name)
+                name, title = oTitle, 'XXX'
+            if not name:
+                name = oTitle
+        elif not name:
+            name = title
+            title = None
+        if name == title or url == title:
+            title = None
+        return self.formatter.link(name.strip(), url, title)
+
+    def handle_linkWithoutMiddleStop(self, group):
+        if self.getVar('state') != 'linkName':
+            return None
+        formattedText = self.getVar('formattedText')
+        self.pullState()
+        return self.formatter.text('[') \
+               + formattedText \
+               + self.formatter.text(']')
+
+    def handle_listLineStart(self, group):
+        matchObject = re.match(
+            r'^(?P<indent> *)-((?P<type>[0-9aAiI])\.)?',
+            group)
+        indent = len(matchObject.group('indent'))
+        type = matchObject.group('type')
+        list = self.getVar('list')
+        list.append([indent, type, None])
+        return None
+
+    def handle_listLineContinuation(self, group):
+        return None
+
+    def handle_listLineStop(self, group):
+        list = self.getVar('list')
+        list[-1][-1] = self.getVar('formattedText').lstrip()
+        self.setVar('formattedText', '')
+        return None
+
+    def handle_listStart(self, group):
+        self.pushState({
+            'formattedText': '',
+            'list': [],
+            'regexpObject': self.listRegexpObject,
+            'state': 'list',
+            })
+        return self.handle_listLineStart(group)
+
+    def handle_listStop(self, group):
+        if self.getVar('state') != 'list':
+            # The following pullState is mandatory, because group is empty, so
+            # if we don't pull a state, handle_listStop will be called forever.
+            if len(self.states) > 2:
+                self.pullState()
+            return None
+        self.handle_listLineStop(group)
+        list = self.getVar('list')
+        self.pullState()
+        return self.formatter.list(list)
+
+    def handle_nonBreakingSpace(self, group):
+        return self.formatter.nonBreakingSpace()
+
+    def handle_paragraphStart(self, group, ignoreEmptyParagraph = 1):
+        self.pushState({
+            'formattedText': '',
+            'ignoreEmptyParagraph': ignoreEmptyParagraph,
+            'regexpObject': self.paragraphRegexpObject,
+            'state': 'paragraph',
+            })
+        return None
+
+    def handle_paragraphStop(self, group, ignoreEmptyParagraph = 0,
+                             isLastParagraph = 0):
+        if self.getVar('state') != 'paragraph':
+            return None
+        formattedText = self.getVar('formattedText').strip()
+        ignoreEmptyParagraph = ignoreEmptyParagraph \
+                               or self.getVar('ignoreEmptyParagraph')
+        self.pullState()
+        self.setVar('paragraphsCount', self.getVar('paragraphsCount') + 1)
+        if ignoreEmptyParagraph and not formattedText:
+            return None
+        elif isLastParagraph and self.getVar('paragraphsCount') == 1:
+            return formattedText
+        elif re.match('^<strong>.+</strong>$', formattedText) and \
+                len(re.findall('<strong>.+?</strong>', formattedText)) == 1:
+            formattedText = formattedText[8:-9]
+            return self.formatter.intertitle(formattedText, sublevel = 1)
+        else:
+            return self.formatter.paragraph(formattedText)
+
+    def handle_punctuationAndSpace(self, punctuation):
+        return self.formatter.punctuationAndSpace(punctuation)
+
+    def handle_rowStart(self, group):
+        table = self.getVar('table')
+        table.append([])
+        return self.handle_cellStart(group)
+
+    def handle_rowStop(self, group):
+        return self.handle_cellStop(group)
+
+    def handle_spaceAndPunctuation(self, punctuation):
+        return self.formatter.spaceAndPunctuation(punctuation)
+
+    def handle_strongStart(self, group):
+        if self.getVar('state') == 'table' and self.getVar('hasHeader'):
+            return None
+        self.pushState({
+            'formattedText': '',
+            'state': 'strong',
+            })
+        return None
+
+    def handle_strongStop(self, group):
+        if self.getVar('state') != 'strong':
+            return None
+        formattedText = self.getVar('formattedText')
+        self.pullState()
+        return self.formatter.strong(formattedText)
+
+    def handle_tableStart(self, group, hasHeader = 0):
+        self.pushState({
+            'formattedText': '',
+            'hasHeader': hasHeader,
+            'table': [],
+            'regexpObject': self.tableRegexpObject,
+            'state': 'table',
+            })
+        return self.handle_rowStart(group)
+
+    def handle_tableStop(self, group):
+        self.handle_rowStop(group)
+        table = self.getVar('table')
+        hasHeader = self.getVar('hasHeader')
+        self.pullState()
+        return self.formatter.table(table, hasHeader)
+
+    def handle_tableWithHeaderStart(self, group):
+        return self.handle_tableStart(group, hasHeader = 1)
+
+    def handle_teletypeStart(self, group):
+        self.pushState({
+            'formattedText': '',
+            'state': 'teletype',
+            })
+        return None
+
+    def handle_teletypeStop(self, group):
+        if self.getVar('state') != 'teletype':
+            return None
+        formattedText = self.getVar('formattedText')
+        self.pullState()
+        return self.formatter.teletype(formattedText)
+
+    def handle_word(self, word):
+        return self.formatter.text(word)
+
+    def handle_wordAsIs(self, word):
+        return word
+
+    def handle_wordInUrl(self, word):
+        return word
+
+    def hasVar(self, name):
+        for state in self.states:
+            if state.has_key(name):
+                return 1
+        else:
+            return 0
+
+    def pullState(self):
+        del self.states[0]
+
+    def pushState(self, state):
+        self.states.insert(0, state)
+
+    def setVar(self, name, value):
+        self.states[0][name] = value
+
+
+def makeHtmlFromSpip(text, simple = 0, inline = 0, **keywords):
+    if not text:
+        return ''
+
+    text = text.replace('\r\n', '\n').replace('<quote></quote>', '')
+    #text = text.replace('\x91', "'").replace('\x92', "'").replace(
+    #        '\x93', "'").replace('\x94', "'").replace(
+    #        '\x81', "'").replace('\x82', "'").replace(
+    #        '&#8217;', "'").replace('&#8230;', '...').replace(
+    #        '&#8211;', '--').replace('&#8220;', '"').replace(
+    #        '&#180;', "'").replace('&#8221;', '"').replace(
+    #        '&#8216;', "'").replace('&#339;', 'oe')
+
+    if not inline:
+        # Force the spip parser to produce paragraphs.
+        text += '\n\n'
+    parser = SpipParser()
+    if simple:
+        formatter = FormatterHtmlSimple()
+    else:
+        formatter = FormatterHtmlComplete()
+    return parser.format(formatter, text, **keywords).strip()
+
+
+if __name__ == '__main__':
+     print makeHtmlFromSpip(unicode(file(sys.argv[1]).read(), 'utf-8'))
diff --git a/panikdb/emissions/management/commands/load-from-spip.py b/panikdb/emissions/management/commands/load-from-spip.py

index 12b7aff3a67e88149ff7888779754484c1d3e994..afc3ffedbebadfa1d482cc79b365ff8f6900cb29 100644 (file)
--- a/panikdb/emissions/management/commands/load-from-spip.py
+++ b/panikdb/emissions/management/commands/load-from-spip.py
@@ -2,12 +2,14 @@ from datetime import datetime
  import gzip
  import xml.etree.ElementTree as ET
  
-
  from django.core.management.base import BaseCommand, CommandError
  
  from panikdb.emissions.models import Emission, Episode, Diffusion
  
  
+from _spip2html import makeHtmlFromSpip
+
+
  class Rubric(object):
      def __init__(self):
          self.articles = {}
@@ -87,7 +89,7 @@ class Command(BaseCommand):
                      emission = Emission()
                      emission.slug = slug
                  emission.title = rubric.titre
-                emission.description = rubric.texte
+                emission.description = makeHtmlFromSpip(rubric.texte)
                  emission.save()
  
                  for article in rubric.articles.values():
@@ -95,11 +97,7 @@ class Command(BaseCommand):
                          # date_redac was used for the diffusion date, if it's
                          # not set it's probably not really an episode
                          continue
-                    try:
-                        slug = article.url.lower()
-                    except AttributeError:
-                        print 'no slug for article', article.titre
-                        slug = article.id_article
+                    slug = article.url.lower()
                      try:
                          episode = Episode.objects.get(slug=slug)
                      except Episode.DoesNotExist:
@@ -107,7 +105,7 @@ class Command(BaseCommand):
                          episode.slug = slug
                      episode.emission = emission
                      episode.title = article.titre
-                    episode.description = article.texte
+                    episode.description = makeHtmlFromSpip(article.texte)
                      episode.save()
  
                      if not Diffusion.objects.filter(episode=episode).count():
diff --git a/panikdb/emissions/models.py b/panikdb/emissions/models.py

index 32b18a87a2cb00036c08f55efd30cc2d7af77b76..ee95d3d0842eb8bab4e0ee467a81ecea279a9b18 100644 (file)
--- a/panikdb/emissions/models.py
+++ b/panikdb/emissions/models.py
@@ -4,12 +4,13 @@ from django.core.urlresolvers import reverse
  
  from django.db import models
  
+from ckeditor.fields import RichTextField
  
  
  class Emission(models.Model):
      title = models.CharField(max_length=50)
      slug = models.SlugField()
-    description = models.TextField(null=True)
+    description = RichTextField(null=True)
  
      first_diffusion = models.DateTimeField(null=True)
      # other_diffusions = 
@@ -22,7 +23,7 @@ class Episode(models.Model):
      emission = models.ForeignKey('Emission', verbose_name=u'Emission')
      title = models.CharField(max_length=50)
      slug = models.SlugField()
-    description = models.TextField(null=True)
+    description = RichTextField(null=True)
  
      def __unicode__(self):
          return self.title
diff --git a/panikdb/emissions/templates/emissions/emission_detail.html b/panikdb/emissions/templates/emissions/emission_detail.html

index 64783ebadbbc431b626649cccaf8a9da087554a4..90edfed29e761a9902246d33304c55bef6da9a0a 100644 (file)
--- a/panikdb/emissions/templates/emissions/emission_detail.html
+++ b/panikdb/emissions/templates/emissions/emission_detail.html
@@ -5,9 +5,7 @@
  <h2>{{ emission.title }}</h2>
  
  {% if emission.description %}
-<p>
-{{ emission.description }}
-</p>
+{{ emission.description|safe }}
  {% endif %}
  
  <h3>Épisodes</h3>
diff --git a/panikdb/emissions/templates/emissions/emission_form.html b/panikdb/emissions/templates/emissions/emission_form.html

index 0215348d2e1427466deb90964fb7cb99db1faa23..ce1eb367b595f62079f25ed1aca47185d4772d51 100644 (file)
--- a/panikdb/emissions/templates/emissions/emission_form.html
+++ b/panikdb/emissions/templates/emissions/emission_form.html
@@ -1,5 +1,10 @@
  {% extends "panikdb/base.html" %}
  
+{% block extrascripts %}
+<script src="{{ STATIC_URL }}ckeditor/ckeditor/ckeditor.js">
+</script>
+{% endblock %}
+
  {% block content %}
      <form method="post">
        <div id="form-content">
diff --git a/panikdb/emissions/templates/emissions/episode_detail.html b/panikdb/emissions/templates/emissions/episode_detail.html

index 807d58d91828545dabb7cd567da4bdb1d9a1623e..2f5ec9e345ff94056020e718e484462600fc20ef 100644 (file)
--- a/panikdb/emissions/templates/emissions/episode_detail.html
+++ b/panikdb/emissions/templates/emissions/episode_detail.html
@@ -5,9 +5,7 @@
  <h2>{{ episode.emission.title }} — {{ episode.title }}</h2>
  
  {% if episode.description %}
-<p>
-{{ episode.description }}
-</p>
+{{ episode.description|safe }}
  {% endif %}
  
  <h3>Diffusions</h3>
diff --git a/panikdb/emissions/templates/emissions/episode_form.html b/panikdb/emissions/templates/emissions/episode_form.html

index 1d99d2b72b3aeb260e0f64f34c1d53255cb7ca2c..b168367144e51acafc6e8e9ee0f8e5b8a81c8e40 100644 (file)
--- a/panikdb/emissions/templates/emissions/episode_form.html
+++ b/panikdb/emissions/templates/emissions/episode_form.html
@@ -1,5 +1,10 @@
  {% extends "panikdb/base.html" %}
  
+{% block extrascripts %}
+<script src="{{ STATIC_URL }}ckeditor/ckeditor/ckeditor.js">
+</script>
+{% endblock %}
+
  {% block content %}
  
  <h2>Nouvel épisode de « {{ emission.title }} »</h2>
diff --git a/panikdb/settings.py b/panikdb/settings.py

index 1ae5aae5748f06c0933d1074a4ac8302caa90c56..a98ad39d3de062e93cd09f396fca599c9cea99be 100644 (file)
--- a/panikdb/settings.py
+++ b/panikdb/settings.py
@@ -66,6 +66,8 @@ STATIC_ROOT = os.path.join(PROJECT_PATH, 'static')
  # Example: "http://example.com/static/", "http://static.example.com/"
  STATIC_URL = '/static/'
  
+CKEDITOR_UPLOAD_PATH = os.path.join(MEDIA_ROOT, 'uploads')
+
  # Additional locations of static files
  STATICFILES_DIRS = (
      # Put strings here, like "/home/html/static" or "C:/www/django/static".
@@ -119,6 +121,7 @@ INSTALLED_APPS = (
      'django.contrib.messages',
      'django.contrib.staticfiles',
      'django.contrib.admin',
+    'ckeditor',
      'panikdb.emissions',
  )
  
@@ -151,6 +154,13 @@ LOGGING = {
      }
  }
  
+CKEDITOR_CONFIGS = {
+    'default': {
+        'toolbar': 'Basic',
+    },
+}
+
+
  try:
      from local_settings import *
  except ImportError:
diff --git a/panikdb/templates/panikdb/base.html b/panikdb/templates/panikdb/base.html

index 99e1e64f46db4f7cb1d236f7f3c80d26fc8ed57c..b0790daf803a240fbabd290e345821bb7a4e9750 100644 (file)
--- a/panikdb/templates/panikdb/base.html
+++ b/panikdb/templates/panikdb/base.html
@@ -8,8 +8,6 @@
      <script src="{{ STATIC_URL }}js/jquery.js"></script>
      {% block extrascripts %}
      {% endblock %}
-    <link href="http://code.jquery.com/ui/1.10.1/themes/base/jquery-ui.css" rel="stylesheet" type="text/css"/>
-    <link href='http://fonts.googleapis.com/css?family=Merriweather+Sans:400,300,700' rel='stylesheet' type='text/css'/>
      <link rel="stylesheet" type="text/css" media="all" href="{{ STATIC_URL }}css/style.css"/>
    </head>
    <body>
diff --git a/panikdb/urls.py b/panikdb/urls.py

index 493076b4013478cefed9d5e944bb44e3d1d08195..ed2d2738124f0c958c443ab95ff623c01c060699 100644 (file)
--- a/panikdb/urls.py
+++ b/panikdb/urls.py
@@ -1,11 +1,11 @@
  from django.conf.urls import patterns, include, url
  
-# Uncomment the next two lines to enable the admin:
  from django.contrib import admin
  admin.autodiscover()
  
  urlpatterns = patterns('',
      # url(r'^$', 'panikdb.views.home', name='home'),
+    (r'^ckeditor/', include('ckeditor.urls')),
      url(r'^panikdb/', include('panikdb.emissions.urls')),
  
      url(r'^admin/', include(admin.site.urls)),
diff --git a/requirements.txt b/requirements.txt

new file mode 100644 (file)

index 0000000..3d381ec
--- /dev/null
+++ b/requirements.txt
@@ -0,0 +1,2 @@
+Django<1.6
+django-ckeditor
author	Frédéric Péters <fpeters@0d.be>
	Sun, 7 Apr 2013 16:15:57 +0000 (18:15 +0200)
committer	Frédéric Péters <fpeters@0d.be>
	Sun, 7 Apr 2013 16:15:57 +0000 (18:15 +0200)
panikdb/emissions/management/commands/_spip2html.py	[new file with mode: 0644]	patch \| blob
panikdb/emissions/management/commands/load-from-spip.py		patch \| blob \| history
panikdb/emissions/models.py		patch \| blob \| history
panikdb/emissions/templates/emissions/emission_detail.html		patch \| blob \| history
panikdb/emissions/templates/emissions/emission_form.html		patch \| blob \| history
panikdb/emissions/templates/emissions/episode_detail.html		patch \| blob \| history
panikdb/emissions/templates/emissions/episode_form.html		patch \| blob \| history
panikdb/settings.py		patch \| blob \| history
panikdb/templates/panikdb/base.html		patch \| blob \| history
panikdb/urls.py		patch \| blob \| history
requirements.txt	[new file with mode: 0644]	patch \| blob