Subsecciones

Procesamiento de textos

Muchos métodos de interes para manejar cadenas de texto
# Elimina caracteres y separa por espacios
l = "Hola que tal!".strip("!").split() # l=["Hola", "que", "tal"]
# Une utilizando un caracter
s = ",".join(l)  # s="Hola,que,tal"
#Cuenta el número de ocurrencias de un caracter
c = s.count(",") # c=2
# Reemplaza un caracter por otro
ss = s.replace(",", "\t")  # ss="Hola    que    tal"
# Separa por otro tipo de caracter, e invierte la lista
l=ss.split("\t")
l.reverse()     # l=["tal", "que", "Hola"]
# Localiza una subcadena en el string
c=ss.find("tal")  # c=9
c=ss.find("tall") # c=-1 (no encuentra la subcadena)
# Separa por líneas
ml = """Esto es
un texto con
varias lineas"""
l = ml.splitlines()  # l=["Esto es", "un texto con", "varias lineas"]

Expresiones regulares

import sys, re  # Módulo para REGEXPR
# Comprueba direcciones de e-mail
s=raw_input("Introduce un e-mail: ")
if re.match("\w+@\w+\.\w+((\.\w+)*)?", s):
  print "Dirección correcta"

# Busca URLs en un fichero de texto
try:
  f = open("fich.txt","r")
except IOError:
  print "No puedo abrir"
  sys.exit(1)
for l in f:
  # Busca todas las URLs en la línea actual 
  # y guárdalas (sin http) en la lista h
  h = re.findall("http://([^\s]+)", l)
  if h:         # Si la lista no está vacía
    for w in h: # recorrela e imprime las URLs
	print w

# Separa un string en una lista
s = "Uno:Dos.Tres-Cuatro"
l = re.split("[:.-]", s)



Administración de Sistemas e Redes <ASR.USC[at]gmail.com>
Tomás Fernández Pena <tf.pena[at]usc.es>
Última actualización: 30-09-15 17:44 por tomas

Creative Commons License
Curso de Administración de Sistemas y Redes por Tomás Fernández Pena se distribuye bajo la licencia Creative Commons Recoñecemento-Compartir baixo a mesma licenza. 3.0 España.
Trabajo original en persoal.citius.usc.es/tf.pena/ASR.