笨办法学 Python · 续 练习 23:三叉搜索树
来源:互联网 发布:彩票控 知乎 编辑:程序博客网 时间:2024/05/22 08:10
练习 23:三叉搜索树
原文:Exercise 23: Ternary Search Trees
译者:飞龙
协议:CC BY-NC-SA 4.0
自豪地采用谷歌翻译
我们将研究的最后一个数据结构称为三叉搜索树(TSTree),它可以在一组字符串中快速查找字符串。它类似于BSTree
,但是它有三个子节点,而不是两个,每个子节点只是一个字符而不是整个字符串。在BSTree
中,左子节点和右子节点是树的“小于”和“大于”的分支。在TSTree
中,左子节点,中子节点和右子节点是“小于”,“等于”和“大于”的分支。这可以让你选取一个字符串,将其分解成字符,然后遍历TSTree
,每次一个字符,直到找到它或者你到达了末尾。
通过将你要搜索的一组键拆成单个字符的节点,TSTree
高效地使用空间换取时间。每一个这些节点将占用比BSTree
更多的空间,但这允许你仅仅通过比较键中的字符来搜索键。使用BSTree
,你必须比较每个节点的键和被搜索键中的大多数字符。使用TSTree
,你只需要比较被搜索键的每个字母,当你到达末尾,就完成了。
TSTree
的另一件不错的事情是,它知道一个键何时不存在于集合中。想象一下,你的键的长度为 10 个字符,你需要在一组其他的键中找到它,但是如果键不存在,则需要快速停止。使用TSTree
,你可以在一到两个字符的地方停止,到达树的末尾,并且知道这个键不存在。你最多只能比较键中的 10 个字符来发现它,字符比较比BSTree
少得多。
挑战练习
这个练习中,你打算完成另一个“代码大师复制”的一部分,之后独立完成TSTree
。你所需的代码是:
class TSTreeNode(object): def __init__(self, key, value, low, eq, high): self.key = key self.low = low self.eq = eq self.high = high self.value = valueclass TSTree(object): def __init__(self): self.root = None def _get(self, node, keys): key = keys[0] if key < node.key: return self._get(node.low, keys) elif key == node.key: if len(keys) > 1: return self._get(node.eq, keys[1:]) else: return node.value else: return self._get(node.high, keys) def get(self, key): keys = [x for x in key] return self._get(self.root, keys) def _set(self, node, keys, value): next_key = keys[0] if not node: # what happens if you add the value here? node = TSTreeNode(next_key, None, None, None, None) if next_key < node.key: node.low = self._set(node.low, keys, value) elif next_key == node.key: if len(keys) > 1: node.eq = self._set(node.eq, keys[1:], value) else: # what happens if you DO NOT add the value here? node.value = value else: node.high = self._set(node.high, keys, value) return node def set(self, key, value): keys = [x for x in key] self.root = self._set(self.root, keys, value)
你需要使用你学到的“代码大师复制”方法学习。要特别注意如何处理node.eq
路径以及如何设置node.value
。一旦你了解了get
和set
的工作方式,你将实现剩下的函数和所有的测试。要实现的函数有:
find_shortest
给定一个关键字
K
,找到以K
开头的最短键/值对。这意味着如果你的set
中有apple
和application
,那么调用find_shortest("appl")
将返回关联apple
的值。
find_longest
给定一个关键字
K
,找到以K
开头的最长键/值对。这意味着如果你的set
中有apple
和application
,那么调用find_shortest("appl")
将返回关联application
的值。
find_all
给定一个关键字
K
,找到以K
开头的所有键/值对。我会先实现它,然后基于它实现find_shortest
和find_longest
。
find_part
给定一个关键字
K
,找到最短的键,它拥有K
的开头的一部分。研究如何以及在哪里设置node.value
来使其生效。
研究性学习
- 查看原始代码的注释,看看在
_set
过程中,在哪里放置value
。修改它会修改get
的含义吗?为什么? - 确保你使用随机数据来测试,并测量一些性能。
- 你也可以在
TSTree
中进行模糊匹配。我认为这是一个附加题,所以尝试实现它们,看看你想出了什么。模糊匹配是,'a.p.e'
匹配"apple"
、"anpxe"
和"ajpqe"
。 - 如何搜索字符串的结尾?提示:不要过度考虑它。
- 笨办法学 Python · 续 练习 23:三叉搜索树
- 笨办法学 Python · 续 练习 21:二分搜索
- 笨办法学 Python · 续 练习 20:二叉搜索树
- 笨办法学 Python · 续 练习 5:`cat`
- 笨办法学 Python · 续 练习 6:`find`
- 笨办法学 Python · 续 练习 8:`cut`
- 笨办法学 Python · 续 练习 7:`grep`
- 笨办法学 Python · 续 练习 9:`sed`
- 笨办法学 Python · 续 练习 10:`sort`
- 笨办法学 Python · 续 练习 11:`uniq`
- 笨办法学 Python · 续 练习 12:复习
- 笨办法学 Python · 续 练习 3:质量
- 笨办法学 Python · 续 练习 2:创造力
- 笨办法学 Python · 续 练习 13:单链表
- 笨办法学 Python · 续 练习 14:双链表
- 笨办法学 Python · 续 练习 17:字典
- 笨办法学 Python · 续 练习 18:性能测量
- 笨办法学 Python · 续 练习 0:起步
- Ubuntu终端常用的快捷键
- shell 实例之文件操作
- Caffe源码导读(7):LRN层的实现
- 从入门到入门-Spring Boot-CRUD+Transactional
- 每日一题(51)—— 大小端判断
- 笨办法学 Python · 续 练习 23:三叉搜索树
- sparkstreaming直连kafka Java实现 自己管理offset
- 最新 ARKit 演示:手指直接在空中作画
- Spring整合CXF webservice restful 实例
- POJ1577 树的遍历
- 翻转单词序列 vs 左旋转字符串
- 基础dp5
- 剑指offer——普通二叉树的子结构
- Jmeter之数据参数化篇