读文献：两个ADC的故事-Razavi

Introdution

这些年里推出的众多奈奎斯特速率的数据转换器中，有三种应用最广泛：flash，pipelined和SAR。这篇文章中我们会关注后两种，并学习它们的异同。

Brief History

ADC中的pipelining在1967年在专利申请中被TI的工程师提出，如图1中所示，与现在1bit/stage的设计极为相似。而SAR拓扑更老了，可以追溯到1947年的论文以及1957年的专利。如图2中所示，SAR使用机械继电器驱动DAC，DAC输出通过“比较放大器”与输入信号进行比较。CMOS pipelined ADC在二十世纪80年代出现，随后繁荣发展。但CMOS SAR在二十世纪70年代就有报道，直到2000年前它的低功耗潜能被发现前，一直沉寂。

fig1

fig2

Quantization by Binary Search

AD转换包含两个基本部分：采样和量化。后者可以看作是，找到输入对应的模拟估计值，并创建一个该值的“数字等价物”，也就是通过数字域来表征这个电压。

在pipelined和SAR的基本结构中，它们都使用二分搜索算法实现这个过程。图3(a)展示了这样一个过程，每个循环中讲电压与接近的模拟值进行比较，计算余差。二分搜索的目的就是，把余差降低到1LSB以内。图3(b)展示了上个周期的判决结果是如何影响下个周期的比较的。

fig3

Pipelined ADCs

Basic Operation

为了得到基本的流水线结构，我们首先注意到，二进制搜索应该在余差为$V_{in}-V_{REF}/2$ 处开始，这个余差乘2后等于 $2V_{in}-V_{REF}$ ，极性当然不变。因此我们可以构建一个 $2V_{in}-V_{REF}$来为下个循环做准备，如果$2V_{in}-V_{REF}$能够高效紧凑地实现，就很有吸引力了。

图4中展示了一个常用的实现方法，称为“MDAC（Multiple DAC）”级。

fig4

采样模式下，C1和C2（值均为C）跟踪$V_{in}$。在放大模式，C1地左端极板“翻转”到$V_{out}$上去。这时如果opamp增益足够大，电容间失配比较小，那么输出电压就会变到$2V_{in}-V_{REF}$。

为什么是这个电压？
一开始，C1C2连接X点的极板，电荷量都是$-CV_{in}$。C1翻转后，根据电荷守恒，得到下式：
$$-CV_{REF}+C(-V_{out})=-2CV_{in}$$
解得，$V_{out}=2V_{in}-V_{REF}$。

然后，我们就该想想下个周期该怎么进行了。$2V_{in}-V_{REF}$ 被送入下一级MDAC，把这个信号当作新的$V_{in}$的话，下一级的输出就是、$2(2V_{in}-V_{REF})-V_{REF}=4V_{in}-3V_{REF}$，其极性与$V_{in}-3V_{REF}/4$一致。但是根据图3，只有$V_{in}$大于$V_{REF}/2$时，我们才会将输入与$3V_{REF}/4$进行比较；如果$V_{in}$小于$V_{REF}/2$，我们就需要将输入信号与$V_{REF}/4$进行比较，也就是$4V_{in}-V_{REF}$，但这个值又无法直接递归实现，怎么办？

为克服这个困难，我们修改一下MDAC。

当$V_{in}>V_{REF}/2$时，$f(V_{in},V_{REF})=2V_{in}-V_{REF}$；当$V_{in}<V_{REF}/2$时，$f(V_{in},V_{REF})=2V_{in}$。

图5(a)展示了余差，图5(b)展示了在生成余差前，需先将$V_{in},V_{REF}/2$做个比较，根据结果将C2左极板连接到参考电压或者地。

解释一下
这里的“将C2左极板连接到参考电压或者地”指的是什么？上面已经说过，如果在放大模式将C2左极板连接到$V_{REF}$，那么输出就会是$2V_{in}-V_{REF}$；但此时，如果将左极板连接到地，C2两端没有电荷，C1左极板的电荷就是$-2CV_{in}$，此时$V_{out}=2V_{in}$。

fig5

这种情形，电容和比较器同时对输入进行采样。这个电路也称为“SHA-less”前端。

上述原理很容易应用于流水线操作：当一级MDAC位于放大模式时，下一级可以位于采样模式，反之亦然（看图5(c)）。各级MDAC同时运行，意味着转换速度仅收一级MDAC的采样和放大时间影响（通常是第一级）。

这种1bit/stage架构采用流水线设计，结构紧凑，是一种高效的解决方案，尤其是对于flash拓扑达不到的分辨率而言（大约8bit）。

这个结构包括5个不精确来源：$kT/C$以及op-amp噪声，电容失配，有限op-amp增益，op-amp非线性以及比较器失调。这其中，噪声和功率耗散直接相关，电容和运放的缺陷可以在数字域中进行校准，比较器失调可以通过下述的简单修改解决。在高速设计中，还必须解决图5(b)中电容和比较器采样瞬间的失配问题。

我们可以推测，上述架构的硬件和功耗会随着分辨率提高而线性增长。对每个额外的bit，只需要在流水线末端加一级MDAC。但如今的设计对噪声有限制，要求前级（可能还有后续级）使用更大的电容和更高的运放偏置电流。换句话说，整个流水线的硬件和功耗会随着分辨率的提高而呈指数增长。

1.5-Bit/Stage Architecture

让我们回到误差源。可以证明的是，有限的运放增益以及电容失配会改变余差线的斜率，而比较器失配会导致判决点从$V_{REF}/2$移动。图6对这两种情况进行了展示。

fig6

这两种情况，都会让余差“超量程”，但前者即使在“超量程”区域外，也会导致误差（如果只有失调，则只会在超量程的时候有误差）。在这一部分，我们处理后一种情况，也就是比较器失调。我们修改一个结构，让它能够容忍大的失调。

如果我们考虑全差分系统，接下来的研究就会简单许多，这种情况下输入电压变化的范围是$[-V_{REF},+V_{REF}]$。图5(a)展示的残差图被重新绘制，得到图7(a)中：

fig7

表达式为：$f(V_{in},\pm V_{REF})=2V_{in}-V_{REF},V_{in}>0;2V_{in}+V_{REF},V_{in}<0$。

注意到，现在比较器把输入电压和0电压进行比较。举个例子，如果输入是0V，但是比较器错判成了+2mV，那么判决点就不会出现在0V，而余差电压就会超过$+V_{REF}$。我们的目标是，把余差限制在$+V_{REF}$内，那么判决就需要在输入电压到0之前就进行；同理，如果输入电压从正值接近0，判决电压需要足够正，来避免$V_{res}<-V_{REF}$的情况。

这些想法让我们想到了图7(b)中的余差行为，将判决点改为$V_{in}=\pm V_{REF}/4$。当输入电压绝对值大于$V_{REF}/4$时，余差表达式还是上面的式子；当绝对值小于$V_{REF}/4$时，余差表达式为$V_{res}=2V_{in}$。

事实上，我们只要将输入放大两倍，不增减$V_{REF}$，就能避免0电压附近的误差。如图7(c)所示，该实现使用了两个比较器，称为“1.5bit/stage”结构（好复杂！！！逻辑电路一大堆）。这种拓扑可以容忍$\pm V_{REF}/4$高的比较器失调。我们可以说，每个阶段都使用了一般的“冗余”来适应失调。比较器的低功耗特性使这种拓扑结构比 1bit/stage 的拓扑结构更受青睐。

流水线中，各级的分辨率不必局限于1.5bit.在前端使用闪存级[图7(c)中超过两个比较器]尤为重要，因为其可以减轻运放需要的增益和输出摆幅。例如，具有1位冗余的4位flash次级 ADC 可将运算放大器的开环增益降低 8 倍，而功耗却可以忽略不计。

图7(b)中展示了，电容失配和op-amp有限增益带来的误差，可以通过数字校正移除。pipelined ADC的性能主要受限于其op-amp的性能，这一问题在低压纳米技术中变得更加严重，并导致向SAR架构迁移。

SAR ADCs

Basic Operation(for SAR)

SAR ADC是在输入冻结的时候，在多周期内进行循环。图8概念地展示了它的结构。

fig8

SAR 工作也可以看作是负反馈回路的收敛：比较器的高增益（在此充当砰砰减法器）迫使 VDAC 接近 Vsamp（可能经过一些 “振铃”）。

SAR结构之美源于其三个特性：高分辨率能力，不需要放大器，可以在零静态功耗运行。此外，比较器失调也只会移动静态转移曲线，而不是造成失真。SAR ADC是 “尽可能数字化 “架构的典范。

图9帮助我们理解SAR工作原理：

fig9

图9(c)展示了余差的变化。持续进行转换，直到余差小于1LSB。我们注意到，每个周期能够得到1bit结果。

图10中展示的“时间树状轨迹”，我们将利用它进行时域分析。

fig10

SAR Issues

尽管SAR简单又高效，但也存在一些问题，如果想获得高性能，就需要额外的电路和架构技术。我们在这部分指出问题，在下一部分指出解决方案。

首先由于一次转换需要多周期，SAR速度慢。看图9(a)中的关键路径，需要比较器响应时间$t_{comp}$，需要逻辑电路延迟$t_{logic}$，需要DAC建立时间$t_{DAC}$，一次转换就需要大约$N(t_{comp}+t_{logic}+t_{DAC})$。对给定的CMOS节点，这三个部分的每个部分都有下限，与功率耗散关系不大，因此限制了ADC速度。

第二，SAR要求其DAC具有高精度和高分辨率。流水线每级只需要两个电容，而SAR DAC总的电容量能达到$2^{N}$，全差分则还要翻倍。大电容面积大，则高分辨率SAR的面积会很大。

第三，没有余差放大器，则噪声会限制性能。

pipelined ADC和SAR ADC有一些共同的问题，电容的失配需要数字校正，而产生参考电压的电路必须是快建立且低噪声的。

SAR Speed Improvement

这里说了三个能够改善转换速率的技术。

第一个，也是最明显的方法，多通道交织，按比例提高转换率。

第二个方法是，每个周期解决1bit以上。例如，三个比较器可以将输入与三个模拟估计量进行比较，提供2bit信息。但怎么在连续的周期中生成模拟估计量？图11中有所展示，每个量都要用DAC生成。

fig11

在第一个转换周期中，我们设定：$V_{DAC1}=3V_{REF}/4,V_{DAC2}=V_{REF}/2,V_{DAC3}=V_{REF}/4$。得到一次判决结果后，下个周期就再通过三个DAC电压，把新区间分成4份，以此类推。这样的话复杂度，面积和输入电容都会增长。使用电阻网络充当DAC也可以，但其对应的开关阵列就会复杂而缓慢了。最近的研究表明，每个周期的分辨率可达3位。

第三个方法与DAC速度有关，采用冗余技术，允许每个转换周期内不完全的DAC建立。为了理解这个概念，我们可以参考图12中的5bit网格图：

fig12

一开始，将DAC的输出打到16LSB，也就是半量程点。在$t=t_1$时刻进行判决，输入电压更大，应该将DAC输出打到24LSB。但是在下一个判决门限，也就是$t=t_2$时刻，DAC输出还没有建立到24LSB，恰好输入电压位于这个电压和24LSB之间，那么就发生了错判，下一个时刻DAC理论输出应该是28LSB。由于负反馈，这时DAC输出应该再减小，但最终结果25LSB还是与23LSB有误差。

这是因为，这个设计中没有包含冗余，所以才导致了误差的出现。

让我们开动脑筋，如何增加冗余，才能够适应DAC的不完全建立？我们观察到两点：第一，$t=t_2$时刻的判决是错误的，并不可逆地设置了寄存器中的一位，环路没有能力重置这一位，导致DAC输出中的错误始终存在；第二，$t=t_2$后的任何修正都需要额外的时钟周期。因此，“冗余”既需要为DAC提供足够的超量程补偿，也需要额外的时钟周期。由于图12(a)中错误地为DAC输出增加了4LSB，因此后续周期必须提供至少4LSB的修正，加上24LSB与$V_{in}$的原始误差。

图12(b)中的树状结构，是SAR冗余的一个例子，这里简单起见，我们认为DAC输出中，0到16LSB的变化是缓慢的。与二进制搜索相比，这里的栅格跳跃更小，但包含的转换周期也更多。如果$V_{in}=12.5LSB$，DAC的输出没有达到16LSB的标称值，那么在$t=t_2$时刻，会产生一个23LSB-16LSB=7LSB的误差。有高增益的环路可以通过降低$V_{DAC}$来抵消这一效果。能力的代价是额外的周期。非二进制增量无需更改DAC设计，可通过更改寄存器后的查找表来实现。

DAC Complexity Reduction

通过不同的电路技术，可以降低CDAC中电容的数目。常用的方法设计“桥接”电容，以减少DAC一个部分对输出的贡献，从而产生更精细的步进。图13(a)展示了一个8bit系统，想法是通过$C_B$来减弱DAC输出摆幅的影响。

fig13

例如，图13(b)中展示的，在下极板有$\Delta V$的变化，8C的电容在精细DAC中产生的电压是$V_Y = (8/255)\Delta V$，而粗糙DAC中产生的电压是$V_Y = 16\times (8/255)\Delta V$。因此，该阵列只需要31个单位电容，就能达到8bit的分辨率。

尽管如此，桥接电容也会受到基板寄生电容的影响，在X和Y之间引入接地电容，导致DAC输出错误。为了解决这个问题，我们构建了图13(c)所示的电容器。其中一块板由金属8制成，并由金属-7和金属-8层及通孔笼罩。这种几何形状可确保从金属 8 到地之间的电场线几乎可以忽略不计，因此与该终端相关的寄生极小。电容器的另一端确实对地寄生了Cp，但如果像图13(a)中那样连接到节点 Y，它只会产生 DAC 增益误差，这在 SAR 环境中是可以容忍的。