mcmc_mixing.sage

from matplotlib import pyplot as plt
from operator import lt

@interact
def scrabble_expected(initial_dist = selector(['Uniform','Random','Pure'], label = 'Initial Distribution: '), 
                      initial_letter = input_box(['z'], label = 'Initial Letter for Pure: '),
letter_walk = selector(['Keyboard','Cycle', 'Path' ],  label = 'Walk on Individual Letters: '), mcmc_target = selector(['None','Uniform', 'Scrabble Score','Scrabble Count', 'Alphabetical (a=1, etc.)'], label = 'MCMC Distribution: '), num_steps = input_box(default=100,label='Number of Steps: '), auto_update=False):

	scrabble_bag = ['a','a','a','a','a','a','a','a','a','b','b','c','c','d','d','d','d','e','e','e','e','e','e','e','e','e','e','e','e','f','f','g','g','g','h','h','i','i','i','i','i','i','i','i','i','j','k','l','l','l','l','m','m','n','n','n','n','n','n','o','o','o','o','o','o','o','o','p','p','q','r','r','r','r','r','r','s','s','s','s','t','t','t','t','t','t','u','u','u','u','v','v','w','w','x','y','y','z',' ',' ']

	scrabble_points = {' ':0.00001,'a':1,'b':3,'c':3,'d':2,'e':1,'f':4,'g':2,'h':4,'i':1,'j':8,'k':5,'l':1,'m':3,'n':1,'o':1,'p':3,'q':10,'r':1,'s':1,'t':1,'u':1,'v':4,'w':4,'x':8,'y':4,'z':10 }
	scrabble_count = {' ':2,'a':9,'b':2,'c':2,'d':4,'e':12,'f':2,'g':3,'h':2,'i':9,'j':1,'k':1,'l':4,'m':2,'n':6,'o':8,'p':2,'q':1,
			  'r':6,'s':4,'t':6,'u':4,'v':2,'w':2,'x':1,'y':2,'z':1 }

	alphabet=['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z',' ']
	key1 ={'q':['w','a'],'w':['e','a','s'],'e':['r','s','d'],'r':['t','d','f'],'t':['y','f','g'],'y':['u','g','h'],'u':['i','h','j'],'i':['o','j','k'],'o':['p','k','l'],
	'p':['l'],'a':['s','z'],'s':['d','z','x'],'d':['f','x','c'],'f':['g','c','v'],'g':['h','v','b'],'h':['j','b','n'],'j':['k','n','m'],'k':['l','m'],'z':['x'],'x':['c'],'c':['v',' '],'v':['b',' '],'b':['n',' '],'n':['m',' '],'m':[' ']}
	cyclic = {alphabet[x]:[alphabet[(x+1)%27]] for x in range(27)}
	pathic = {alphabet[x]:[alphabet[x+1]] for x in range(26)}
	g2=Graph(pathic)
	g=Graph(cyclic)
	h=Graph(key1)
	
	
	if letter_walk == 'Cycle':
		graph = g
		bag = alphabet
		bvg = 0

	elif letter_walk == 'Path':
		graph = g2
		bag = alphabet
		bag = bag + bag
		bag.pop(0)
		bag.pop(-1)
		bvg = 0
		
	elif letter_walk == 'Keyboard':
		graph = h
		bag = []
		for e in graph.edges():
			bag.append(e[0])
			bag.append(e[1])
		bvg = 0 
		
 	if mcmc_target == 'Scrabble Score':
		scores = scrabble_points
		
	if mcmc_target == 'Scrabble Count':
		scores = scrabble_count

	if mcmc_target == 'Uniform':
		scores = {x:1 for x in alphabet}
		
	if mcmc_target == '# Vowels':
		scores = {x:1 for x in alphabet}
		scores['a'] = 100
		scores['e'] = 100
		scores['i'] = 100
		scores['o'] = 100
		scores['u'] = 100
		scores['y'] = 50
		
	
	if mcmc_target == 'Alphabetical (a=1, etc.)':
		scores = {alphabet[i]: i+1 for i in range(27)}      

		
	alpha_pos = {alphabet[x]:x for x in range(len(alphabet))}

	proposal_vec = [bag.count(x) for x in alphabet]
	#print(alpha_pos)
	proposal_sum = sum(proposal_vec)
    
	proposal_vec = [float(proposal_vec[alpha_pos[x]])/proposal_sum for x in alphabet]
	#print(proposal_vec)	
    
	if mcmc_target == 'None':
		target_vec = proposal_vec
	else:       
		target_vec = [scores[x] for x in alphabet]
    
		target_sum = sum(target_vec)
	
		target_vec = [float(target_vec[alpha_pos[x]])/target_sum for x in alphabet]
	
	if mcmc_target == 'None':
		N=[]
		
		for le in range(27):
			N.append([])
			for new in range(27):
				if graph.has_edge((alphabet[le],alphabet[new])): 
					N[le].append(1/float(len(graph.neighbors(alphabet[le]))))
				else:
					N[le].append(float(0))
					
		N=Matrix(N)
		
	
	else: 
	
		N=[]
		
		for le in range(27):
			N.append([])
			for new in range(27):
				if graph.has_edge((alphabet[le],alphabet[new])): 
					N[le].append((1/float(len(graph.neighbors(alphabet[le]))))* min(1, (float(scores[alphabet[new]])/scores[alphabet[le]])*(float(len(graph.neighbors(alphabet[le])))/float(len(graph.neighbors(alphabet[new])))))   )
				else:
					N[le].append(float(0))
                    
		for le in range(27):
			for new in graph.neighbors(alphabet[le]):
				N[le][le] +=(1/float(len(graph.neighbors(alphabet[le]))))* (1 -  min(1, (float(scores[new])/scores[alphabet[le]])*(float(len(graph.neighbors(alphabet[le])))/float(len(graph.neighbors(new))))) )		
			
		N=Matrix(N)


	if initial_dist == 'Uniform':
		init_vec =[float(1/27) for x in alphabet]
	elif initial_dist == 'Random':
		init_vec = [random() for x in alphabet]
		init_sum = sum(init_vec)
		init_vec = [x/init_sum for x in init_vec]
	elif initial_dist == 'Pure':
		init_vec = [0 for x in alphabet]
		#init_sum = sum(init_vec)
		init_vec[alpha_pos[initial_letter[0]]] = float(1)
    
	#init_vec[alpha_pos[start_word[0]]]=float(1)
    
	vtp = matrix(RR,num_steps,27)
	vtp[0,:] = matrix(init_vec)
    
	#print(vtp)
	tvs=[.5*sum([abs(vtp[0,ind]-proposal_vec[ind]) for ind in range(27)])]
	tvs2=[.5*sum([abs(vtp[0,ind]-target_vec[ind]) for ind in range(27)])]

	for z in range(num_steps-1):
		vtp[z+1,:]=vtp[z,:]* N
		tvs.append(.5*sum([abs(vtp[z,ind]-proposal_vec[ind]) for ind in range(27)]))
		tvs2.append(.5*sum([abs(vtp[z,ind]-target_vec[ind]) for ind in range(27)]))
		
        
	plt.figure()
	plt.plot(range(num_steps),tvs,'bo')
	plt.title("TV to Proposal")
	plt.xlabel("Step Number")
	plt.ylabel("Total Variation")
	plt.show()

	plt.figure()
	plt.plot(range(num_steps),tvs2,'bo')
	plt.title("TV to Target")
	plt.xlabel("Step Number")
	plt.ylabel("Total Variation")
	plt.show()

	plt.figure()
	import pylab
	#print(vtp)
	pylab.imshow(vtp[:,:],cmap='jet', aspect='auto')#,origin='lower',colorbar=True, colorbar_orientation='vertical')
	plt.colorbar()
	#pylab.imshow(N,cmap='jet')
	#matrix_plot(vtp[1:,:],cmap='jet',origin='lower',colorbar=True, colorbar_orientation='vertical',figsize=8)
	ax = plt.gca()
	ax.set_xticks(range(len(alphabet)))
	ax.set_xticklabels(alphabet)
	#ax.set_yticks(range(len(alphabet)))
	#ax.set_yticklabels(alphabet)  
	plt.show()   
	plt.close()    

	pretty_print("Initial Total Variation to Proposal: ",tvs[0])
	pretty_print("Initial Total Variation to Target: ",tvs2[0])