第一篇:网络编码知识小结
注:本小结报告来自两份论文
[1]上角标1代表 论文 <网络编码的研究进展> 杨林 郑刚等
[2]上角标2代表 论文 <网络编码研究综述> 陶少国等
网络编码研究综述
万里 基本概念
起源:R.Alshwede的蝴蝶网络模型定义:网络编码是一种融合编码和路由的信息交换技术,在传统存储转发的路由方法基础上,通过允许对接收的多个数据包进行编码信息融合,增加单次传输的信息量,提高网络整体性[1]能。
[1]本质:利用节点的计算能力提高链路带宽的利用率。核心思想:具备编码条件的网络节点对接收到的信息进行编码,然后传输给下一级的网络节点,收到信息的下一级节点如果具备编码条件,又对其接受的信息按照同样的方式进行传输与处理,如此反复,直到所有经过处理后的信息汇聚到信宿节点为止。最后,在信宿节点,[2]通过译码,即可译出信源发送的原始信息。主要优缺点: 优点: 提升网络吞吐量 2 均衡网络负载
从作者的例子[Fig.2]可以看出,虽然传输链路增加了,但是每条链路上传输的信息更均衡,解决了网络拥塞问题。3 提高带宽利用率
同2,虽然传输链路增多了,但是每条链路上的信息减少了(均衡了),总体是减少了网络带宽,提高了网络带宽利用率。缺点:
虽然网络编码优点突出, 但运用网络编码增加了计算的复杂性, 而且网路节点需要缓存足够的输入信息, 因此编码操作增加了传输时延和节点的额外的I/ O、CPU消耗。统计数据表明, 即使应用最有效的随机网络编码,其编码和译码的时间也不容忽视。此外, 应用网络编码还存在同步问题, 这主要是由于信宿节点必须等待收到足够的编码信息, 才能开始
[2]译码。同步问题给在实时系统中应用网络编码提出了挑战。
[2] 2 原理与数学模型
2.1网络编码分类
网络编码按照节点输出和输入的关系可划分为线性网络编码和非线性网络编码 网络编码按照编码系数生成的随机性可划分为随机网络编码和确定性网络编码(通过算[1] 法算出系数)2.2线性网络编码
目前的网络编码研究均局限于有限域中的线性网络编码。2.3几个基本概念 信息流:信源发送的信息,链路传输的信息以及信宿接收到的信息,均以向量形式取
[2]之于有限域。称其为信息流。本地编码向量:将节点上的信息流作为节点输入链路上传输信息的线性组合。[链路的消息流与输入链路的消息流的映射关系] 3 全局编码向量:将信源发送信息表示成信息流向量,将链路上传输的信息流当做信源向量的信息流向量各元素的线性组合,该线性组合系数构成的向量就是该链路的全局编码向量。[链路的消息流与信源的信息流的映射关系] 备注:如果忘记 可以参考论文2中的Fig.3 2.4数学模型
[2] 3网络编码的构造方法
网络编码的KEY:求得每条链路对应的编码向量 3.1集中式编码方法 3.1.1 指数时间算法
设N1,N2,...,Nn表示所有编码链路对应的编码向量, 则必定存在函数关系: p = f(N1,N2,..,Nn),并称使p=0的点(N1,N2 , ⋯,Nn)的集合称为被“函数p 分割出来的代数簇”,[2]因而算法的目标就是求得一个不位于“函数p分割出来的代数簇”上的点(p0)。3.1.2 多项式时间算法
3.1.3其他算法 1引入通用LCM(贪婪算法与启发式算法)可实现多速率的网络编码
但是由于计算量大,实现过程复杂,不实用(作为多速率网络编码的探索,具有很重要的意义)
2线性多播、线性广播和线性扩散:线性扩散是线性广播的特例, 线性广播是线性多播的特例, 反之不成立.线性广播说明了通过增加信源发送的信息流向量的维数, 可以提升传输
[2]速率;线性扩散能保证信源节点以互补的形式发送信息流。
[1]3冲突图法、矩阵满秩法、图染色法等几种构造方法。3.2分布式编码方法 3.2.1确定系数构造法
其核心思想是将网络拓扑分解成多个子树,并保证每个子树的编码矢量属于其父树编码
[1]矢量的扩张空间,且任意两个子树的共有信宿的编码矢量均线性无关。3.2.2随机系数网络编码
随机网络编码(简称RNC),该方法基于一种随机选择编码向量的策略:对于除了信宿节点外的所有中间节点,只要在一个足够大的有限域上随机选择它们输入链路到输出链路的映射,而且各节点映射关系的选取是相互独立的,就能以较高概率使各个信宿节点对应的系统转移矩阵满秩,即各信宿节点能以较高的概率成功译码。与时间多项式算法总能保证成功译码不同, 在RNC 中,虽然不能确保最终形成的系统转移矩阵M满秩, 但由于是随机选择编码向量, 其复杂性与确定性算法相比要低得多, 更易于实现, 而且99%以上的译码成功率在一般情况也足以满足需求.因此,随机网络编码具有重要的理论价值和应用价值,得到了广泛的关注和
[2]应用, 如微软提出的P2P文件共享系统Avalanche便是基于RNC的典型应用。3.3集中式与分布式的比较
集中式:需要了解全局拓扑以分配编码系数,可扩展性差。
确定分布式:掌握局部拓扑即可对入编信息进行编码,但需要通信开销。
[1]随机网络编码:实用性强,需要较大的字母表,存在解码失败概率。
4性能参考以及优化
网络编码的主要性能指标包括字母表、编解码速度和编码增益等.其中,字母表是最重要的性能指标,决定了网络编码解的存在性、编解码复杂度、延时以及存储开销.编解码速度反映了编解码操作的计算复杂度.编码增益则表征网络带宽的利用效率.网络编码设计的一个重要目标就是尽可能使用小的字母表和低复杂度的编解码操作来提高网络吞吐量或减[1]小延时.
4.1网络编码复杂性的影响因素分析 4.1.1编码构造方法
网络编码的核心,目标是寻找复杂性低的算法(分布式与集中式的共同目标)。4.1.2编码操作数
可从三个角度分析:信息分组、编码链路和编码节点, 其中从信息分组的角度减少其操作数目是降低编码操作复杂性最理想的方式, 但是分析的难度较大, 一般均从减少编码链
[2]路或者节点的数目来考虑。4.1.3有限域的大小
保证足够的译码成功率的前提下(有限域过小,译码成功率降低), 应尽量减少有限域的大小。
4.2基于简单网络的解决方案
将普通网络转化为某种易于表达, 且各网络节点具有共同特征的“简单网络”将普通网络转化为简单网络, 其网络拓扑变得十分简单,但一个不容忽视的问题就是: 简单网络的规模(节点数)比原普通网络却膨胀了许多, 也就是说网络编码的代价被放大了,“简单网络”的最小代价并不等于原网络的最小代价.但是, 将网络“简化”处理的思想在方法论上具有
[2]重要的借鉴意义,为最小代价的网络编码提供了研究方向。4.3基于信息流
信息流分解的基本原理是按照网络中信息流的特征和共性, 将原网络节点划分为一系列的子树图, 这些子树图中的节点拥有相同的编码向量, 子树里面的节点的拓扑结构不影
[2]响整个系统的多播传输, 因此每个子树可以当作一个节点来处理。4.4基于最小代价函数的解决方案
借鉴路由多播的最小代价树,将网络编码转化为线性规划问题。
5应用与研究趋势
5.1应用领域
[1]Ad Hoe网络、传感器网络、P2P内容分发、分布式文件存储和网络安全等领域。
[2]无线网络、应用层多播和P2P文件共享、传输的差错控制。5.2研究趋势
5.2.1多源网络编码
对于信源数目大于2的网络编码多播,研究不够充分,但多源多播广泛存在。5.2.2非组播网络
对于非组播网络的网络编码理论研究。5.2.3非线性网络编码
非线性研究尚未起步,性能还不可知,比线性网络编码要求与难度更高。5.2.4具体实现
网络编码的具体实现需要考虑诸多因素,也是有意义的研究方向。5.2.5与其他领域的融合
与信源编码的联合设计与优化、与信道编码和调制技术的结合、与多描述分层编码的结合。
5.2.6降低网络编码复杂度
降低网络编码复杂度,实现最小代价网络编码。5.2.7安全方面
无线网络编码在安全方面的研究。
第二篇:个人网络流知识小结
个人网络流知识小结好啊,入门资料,包括简单介绍网络流的知识概念以及Dinic的算法介绍,主要思想就是bfs进行分层,在dfs找增广路径,以及ISAP算法介绍,很全了
HDU3549 最简单的网络流入门题,poj1273 先是写了最基础的 Edmonds-karp(EK)算法,时间复杂度为O(VE2)有邻接矩阵的实现,还有邻接边的实现,后者容易出错!编程复杂度加大,不过效率较矩阵高
对于EK算法与ISAP算法的区别:
EK算法每次都要重新寻找增广路,寻找过程只受残余网络的影响,如果改变残余网络,则增广路的寻找也会随之改变;SAP算法预处理出了增广路的寻找大致路径,若中途改变残余网络,则此算法将重新进行。EK处理在运算过程中需要不断加边的最大流比SAP更有优势
3.Dinic算法 O(v2E)代码分别有递归的实现,和非递归的实现版本
算法思想主要如下:
1.初始化流量,计算出剩余图
2.根据剩余图,计算层次图,如果汇点不在层次图中,那么算法结束
3.在层次图内不断用bfs增广,直到层次图内没有增广路为止
转2
4.ISAP算法,别人写的很好,理解了,直接摘抄了,引用http:///?p=34 众所周知,在网络流的世界里,存在2类截然不同的求解思想,就是比较著名的预流推进与增广路,两者都需要反向边的小技巧。
其中预流推进的算法思想是以边为单元进行推流操作。具体流程如下:置初始点邻接边满流并用一次反
向bfs对每个结点计算反向距离标号,定义除汇点外存量大于出量的结点为活动结点,每次对活动结点按允许边(u->v:d[u]=d[v]+1)进行推流操作,直到无法推流或者该点存量为0,若u点此时仍为活动结点,则进行重标号,使之等于原图中进行推操作后的邻接结点的最小标号+1,并将u点入队。当队列为空时,算法结束,只有s点和t点存量非0,网络中各顶点无存量,无法找到增广路继续增广,则t点存量为最大流。
而增广路的思想在于每次从源点搜索出一条前往汇点的增广路,并改变路上的边权,直到无法再进行增广,此时汇点的增广量即为最大流。两者最后的理论基础依然是增广路定理,而在理论复杂度上预流推进要显得比较优秀。其中的HLPP高标预流推进的理论复杂度已经达到了另人发指的O(sqrt(m)*n*n),但是其编程复杂度也是同样的令人发指--
于是我们能否在编程复杂度和算法复杂度上找到一个平衡呢,答案是肯定的。我们使用增广路的思想,而且必须进行优化。因为原始的增广路算法(例如EK)是非常悲剧的。于是有人注意到了预流推进中的标号法,在增广路算法中引入允许弧概念,每次反搜残留网络得到结点标号,在正向增广中利用递归进行连续增广,于是产生了基于分层图的Dinic算法。一些人更不满足于常规Dinic所带来的提升,进而加入了多路分流增广的概念,即对同一顶点的流量,分多路同时推进,再加上比较复杂的手工递归,使得Dinic已经满足大部分题目的需要。
然而这样做就是增广路算法优化的极限么?答案永远是不。人们在Dinic中只类比了预流推进的标号技术,而重标号操作却没有发挥得淋漓尽致。于是人们在Dinic的基础上重新引入了重标号的概念,使得算法无须在每次增广后再进行BFS每个顶点进行距离标号,这种主动标号技术使得修正后算法的速度有了不少提高。但这点提高是不足称道的,人们又发现当某个标号的值没有对应的顶点后,即增广路被截断了,于是算法便可以提前结束,这种启发式的优化称为Gap优化。最后人们结合了连续增广,分层图,多路增广,Gap优化,主动标号等穷凶极恶的优化,更甚者在此之上狂搞个手动递归,于是产生了增广路算法的高效算法–ISAP算法。
虽然ISAP算法的理论复杂度仍然不可超越高标预流推进,但其编程复杂度已经简化到发指,如此优化,加上不逊于Dinic的速率(在效率上手工Dinic有时甚至不如递归ISAP),我们没有不选择它的理由。
5.自己的理解
不管怎样,普通的EK一般来说 复杂度是在O(n*m*m)的,而Dinic和ISAP都是O(n*n*m)d的,而ISAP的几个优化,有将效率进一步提升,关于复杂度的分析,算法导论有介绍,主要是理解下后面的分层思想和预留推进思想,以及根据dfs回朔来判断是否可以推进流还是做重标记等,这里可以用ISAP算法和DInic算法,其中主要难点是在网络流的建模上!邻接表的建立也有许多巧妙之处,仅仅是数据结构上的邻接表,效率和空间浪费的简直令人发指!
接下来就是深入的部分,可以看得资料和论文如下:
很好,很全面的学习资料和总结题集《Network Flows-Theory, Algorithms, And Applications》
《Combinatorial optimization:networks and matroids》
解决网络流的几种方案在这里,非常清楚
http://dantvt.is-programmer.com/tag/Dinic
/Files/panzhizhou/国家集训队论文网络流整理.zip
第三篇:Java中文&编码问题小结
2006-03-07 | Java中文&编码问题小结
Java字符编码转换过程说明
常见问题 JVM JVM启动后,JVM会设置一些系统属性以表明JVM的缺省区域。user.language,user.region,file.encoding等。可以使用 System.getProperties()详细查看所有的系统属性。
如在英文操作系统(如UNIX)下,可以使用如下属性定义强制指定JVM为中文环境
-Dclient.encoding.override=GBK-Dfile.encoding=GBK-Duser.language=zh-Duser.region=CN
.javaà.class编译
说明:一般javac根据当前os区域设置,自动决定源文件的编码.可以通过-encoding强制指定.错误可能: 1 gbk编码源文件在英文环境下编译,javac不能正确转换.曾见于java/jsp在英文 unix下.检测方法:写u4e00格式的汉字,绕开javac编码,再在jvm中,将汉字作为 int打印,看值是否相等;或直接以UTF-8编码打开.class文件,看看常量字符串
是否正确保存汉字。
文件读写
外部数据如文件经过读写和转换两个步骤,转为jvm所使用字符。
InputStream/OutputStream用于读写原始外部数据,Reader/Writer执行读写和转
换两个步骤。文件读写转换由java.io.Reader/Writer执行;输入输出流
InputStream/OutputStream 处理汉字不合适,应该首选使用Reader/Writer,如 FileReader/FileWriter。
2`FileReader/FileWriter使用JVM当前编码读写文件.如果有其它编码格式,使用
InputStreamReader/OutputStreamWriter PrintStream有点特殊,它自动使用jvm缺省编码进行转换。
读取.properties文件
.propeties文件由Properties类以iso8859-1编码读取,因此不能在其中直接写汉
字,需要使用JDK 的native2ascii工具转换汉字为uXXXX格式。命令行:
native2ascii –encoding GBK inputfile outputfile
读取XML文件 XML文件读写同于文件读写,但应注意确保XML头中声明如 xml version=” 1.0” encoding=”gb2312” ?>与文件编码保持一致。javax.xml.SAXParser类接受InputStream作为输入参数,对于Reader,需要用 org.xml.sax.InputSource包装一下,再给SAXParser。对于UTF-8编码 XML,注意防止编辑器自动加上uFFFE BOM头, xml parser会报
告content is not allowed in prolog。
字节数组 使用 new String(byteArray,encoding)和 String.getBytes(encoding)在
字节数组和字符串之间进行转换
也可以用ByteArrayInputStream/ByteArrayOutputStream转为流后再用 InputStreamReader/OutputStreamWriter转换。
错误编码的字符串(iso8859-1转码gbk)如果我们得到的字符串是由错误的转码方式产生的,例如:对于gbk中文,由
iso8859-1方式转换,此时如果用调试器看到的字符串一般是 的样子,长度一般
为文本的字节长度,而非汉字个数。
可以采用如下方式转为正确的中文:
text = new String(text.getBytes(“iso8859-1”),”gbk”);
JDBC 转换过程由JDBC Driver执行,取决于各JDBC数据库实现。对此经验尚积累不够。对于ORACLE数据库,需要数据库创建时指定编码方式为gbk,否则会出现汉字转
码错误 对于 SQL Server 2000,最好以nvarchar/nchar类型存放文本,即不存在中文 /编码转换问题。连接 Mysql,将 connectionString 设置成 encoding 为 gb2312:
String connectionString = “jdbc:mysql://localhost/test? useUnicode=true&characterEncoding=gb2312”;
WEB/Servlet/JSP 1 对于JSP,确定头部加上 <%@ page
contentType=“text/html;charset=gb2312”%>这样的标签。对于Servlet,确定 设置setContentType(“text/html;charset=gb2312”),以上两条用于使得输出汉字没有问题。为输出HTML head中加一个 ,让浏览器正确确定HTML编码。为Web应用加一个Filter,确保每个Request明确调用setCharacterEncoding方
法,让输入汉字能够正确解析。
import java.io.IOException;import javax.servlet.Filter;import javax.servlet.FilterChain;import javax.servlet.FilterConfig;import javax.servlet.ServletException;import javax.servlet.ServletRequest;import javax.servlet.ServletResponse;import javax.servlet.UnavailableException;import javax.servlet.http.HttpServletRequest;/** * Example filter that sets the character encoding to be used in parsing the * incoming request */ public class SetCharacterEncodingFilter implements Filter { public SetCharacterEncodingFilter(){} protected boolean debug = false;protected String encoding = null;protected FilterConfig filterConfig = null;public void destroy(){ this.encoding = null;this.filterConfig = null;}
public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain)throws IOException, ServletException { // if(request.getCharacterEncoding()== null)// { // String encoding = getEncoding();// if(encoding!= null)// request.setCharacterEncoding(encoding);// // } request.setCharacterEncoding(encoding);if(debug){ System.out.println(((HttpServletRequest)request).getRequestURI()+“setted to ”+encoding);} chain.doFilter(request, response);}
public void init(FilterConfig filterConfig)throws ServletException { this.filterConfig = filterConfig;this.encoding = filterConfig.getInitParameter(“encoding”);this.debug = “true”.equalsIgnoreCase(filterConfig.getInitParameter(“debug”));}
protected String getEncoding(){ return(this.encoding);} }
web.xml中加入:
encoding gb2312 debug false
其一:在web.xml里加上如下脚本: weblogic.httpd.inputCharset./* GBK
SWING/AWT/SWT 对于SWING/AWT,Java会有些缺省字体如Dialog/San Serif,这些字体到系统真实
字体的映射在$JRE_HOME/lib/font.properties.XXX文件中指定。排除字体显示问
题时,首先需要确定JVM的区域为zh_CN,这样font.properties.zh_CN文件才会发
生作用。对于 font.properties.zh_CN , 需要检查是否映射缺省字体到中文字体
如宋体。
在Swing中,Java自行解释TTF字体,渲染显示;对于AWT,SWT显示部分交由操作系
统。首先需要确定系统装有中文字体。汉字显示为”□”,一般为显示字体没有使用中文字体,因为Java对于当前字
体显示不了的字符,不会像Windows一样再采用缺省字体显示。部分不常见汉字不能显示,一般为显示字库中汉字不全,可以换另外的中文字
体试试。对于AWt/SWT,首先确定JVM运行环境的区域设置为中文,因为此处设计JVM与操
作系统api调用的转换问题,再检查其它问题。
JNI JNI中jstring以UTF-8编码给我们,需要我们自行转为本地编码。对于Windows,可以采用WideCharToMultiByte/MultiByteToWideChar函数进行转换,对于Unix,可以采用iconv库。
这里从SUN jdk 1.4 源代码中找到一段使用jvm String 对象的getBytes的转换方
式,相对简单和跨平台,不需要第三方库,但速度稍慢。函数原型如下:
/* Convert between Java strings and i18n C strings */ JNIEXPORT jstring NewStringPlatform(JNIEnv *env, const char *str);
JNIEXPORT const char * GetStringPlatformChars(JNIEnv *env, jstring jstr, jboolean *isCopy);
JNIEXPORT jstring JNICALL JNU_NewStringPlatform(JNIEnv *env, const char *str);
JNIEXPORT const char * JNICALL JNU_GetStringPlatformChars(JNIEnv *env, jstring jstr, jboolean *isCopy);
JNIEXPORT void JNICALL
JNU_ReleaseStringPlatformChars(JNIEnv *env, jstring jstr, const char *str);
附件jni_util.h,jni_util.c
TUXEDO/JOLT JOLT对于传递的字符串需要用如下进行转码
new String(ls_tt.getBytes(“GBK”),“iso8859-1”)
对于返回的字符串
new String(error_message.getBytes(“iso8859-1”),“GBK”);jolt 的系统属性 bea.jolt.encoding不应该设置,如果设置,JSH会报告说错误的
协议.JDK1.4/1.5新增部分
字符集相关类(Charset/CharsetEncoder/CharsetDecoder)jdk1.4开始,对字符集的支持在java.nio.charset包中实现。
常用功能: 列出jvm所支持字符集:Charset.availableCharsets()2 能否对看某个Unicode字符编码,CharsetEncoder.canEncode()
Unicode Surrogate/CJK EXT B Unicode 范围一般所用为U0000-UFFFF范围,jvm使用1个char就可以表示,对于 CJK EXT B区汉字,范围大于U20000,则需要采用2个char方能表示,此即
Unicode Surrogate。这2个char的值范围 落在Character.SURROGATE 区域内,用 Character.getType()来判断。
jdk 1.4尚不能在Swing中正确处理surrogate区的Unicode字符,jdk1.5可以。对
于CJK EXT B区汉字,目前可以使用的字库为”宋体-方正超大字符集”,随Office 安装。
常见问题
在JVM下,用System.out.println不能正确打印中文,显示为??? System.out.println是PrintStream,它采用jvm缺省字符集进行转码工作,如果 jvm的缺省字符集为iso8859-1,则中文显示会有问题。此问题常见于Unix下,jvm 的区域没有明确指定的情况。
在英文UNIX环境下,用System.out.println能够正确打印汉字,但是内部处理错误 可能是汉字在输入转换时,就没有正确转码:
即gbk文本à(iso8859-1转码)àjvm char(iso8859-1编码汉字)à(iso8859-1转码)à
输出。
gbk汉字经过两次错误转码,原封不动的被传递到输出,但是在jvm中,并未以正
确的unicode编码表示,而是以一个汉字字节一个char的方式表示,从而导致此类
错误。
GB2312-80,GBK,GB18030-2000 汉字字符集
GB2312-80 是在国内计算机汉字信息技术发展初始阶段制定的,其中包含了大部
分常用的一、二级汉字,和 9 区的符号。该字符集是几乎所有的中文系统和国际
化的软件都支持的中文字符集,这也是最基本的中文字符集。其编码范围是高位
0xa1-0xfe,低位也是 0xa1-0xfe;汉字从 0xb0a1 开始,结束于 0xf7fe;
GBK 是 GB2312-80 的扩展,是向上兼容的。它包含了 20902 个汉字,其编码范
围是 0x8140-0xfefe,剔除高位 0x80 的字位。其所有字符都可以一对一映射到
Unicode 2.0,也就是说 JAVA 实际上提供了 GBK 字符集的支持。这是现阶段
Windows 和其它一些中文操作系统的缺省字符集,但并不是所有的国际化软件都
支持该字符集,感觉是他们并不完全知道 GBK 是怎么回事。值得注意的是它不是
国家标准,而只是规范。随着 GB18030-2000国标的发布,它将在不久的将来完成
它的历史使命。
GB18030-2000(GBK2K)在 GBK 的基础上进一步扩展了汉字,增加了藏、蒙等少数
民族的字形。GBK2K 从根本上解决了字位不够,字形不足的问题。它有几个特点,它并没有确定所有的字形,只是规定了编码范围,留待以后扩充。
编码是变长的,其二字节部分与 GBK 兼容;四字节部分是扩充的字形、字位,其
编码范围是首字节 0x81-0xfe、二字节0x30-0x39、三字节 0x81-0xfe、四字节
0x30-0x39。
UTF-8/UTF-16/UTF-32
UTF,即Unicode Transformer Format,是Unicode代码点(code point)的实际表 示方式,按其基本长度所用位数分为UTF-8/16/32。它也可以认为是一种特殊的外
部数据编码,但能够与Unicode代码点做一一对应。
UTF-8是变长编码,每个Unicode代码点按照不同范围,可以有1-3字节的不同长度。
UTF-16长度相对固定,只要不处理大于U200000范围的字符,每个Unicode代码点
使用16位即2字节表示,超出部分使用两个UTF-16即4字节表示。按照高低位字节
顺序,又分为UTF-16BE/UTF-16LE。
UTF-32长度始终固定,每个Unicode代码点使用32位即4字节表示。按照高低位字
节顺序,又分为UTF-32BE/UTF-32LE。
UTF编码有个优点,即尽管编码字节数不等,但是不像gb2312/gbk编码一样,需要
从文本开始寻找,才能正确对汉字进行定位。在UTF编码下,根据相对固定的算法,从当前位置就能够知道当前字节是否是一个代码点的开始还是结束,从而相对
简单的进行字符定位。不过定位问题最简单的还是UTF-32,它根本不需要进行字
符定位,但是相对的大小也增加不少。
关于GCJ JVM GCJ并未完全依照sun jdk的做法,对于区域和编码问题考虑尚不够周全。GCJ启动
时,区域始终设为en_US,编码也缺省为iso8859-1。但是可以用Reader/Writer做
正确编码转换。
第四篇:网络专题知识
第一节 网络专题的内容策划
一、网络专题的选题策划
二、网络专题的角度策划
三、以人民网、新浪网、凤凰网国庆专题为例
一、网络专题的选题策划
网络专题适合于表现各种重大新闻题材。不同的题材在选题策划中考虑的重点有所不同。网络专题的题材主要有以下四种:
1.重大突发事件
2.可预知重大事件
3.重要的社会现象或问题
4.媒体策划的活动
二、网络专题的角度策划
在网络专题的角度策划中,可以参考以下思路:
1.抓住阶段性特征以显示事物的进展 2.通过透视背景来剖析现实
3.通过典型人物反映一群人或一个事件 4.通过典型时刻反映全程
5.以典型空间或环境为场景表现对象 6.通过典型数据勾勒全貌
7.通过典型意见来反映事件的影响 8.以专业眼光审视大众话题
三、以人民网、新浪网、凤凰网国庆专题为例
经过对以上三大国庆网络专题内容上的分析和比较,可知: A、报道内容广、全、深。
B、均精心制作了专题构架。
C、均延续了网络专题的最大特色。
D、图片报道、声视频链接与文字新闻并驾齐驱,成为专题重要的信息传递方式。E、设置评论版块,重视观点的搜集。
F、交互性强,引导受众参与并重视反馈意见。
第二节 网络专题的形式策划
一、网络专题的栏目策划
二、以人民网、新浪网、凤凰网国庆专题为例
一、网络专题的栏目策划
1、网络专题内容的层次 • 核心信息 • 周边信息 • 辐射信息
二、以人民网、新浪网、凤凰网国庆专题为例
版式设计、色彩运用、标题制作、对文字起解释作用的图片共同构成了其外在表现因素。
从页面表现上来看,频道式设计制作是使网络专题区别于其他任何一种网络表现形式的关键所在。
网络专题是指主题相对同一的网络媒体表现形式,它与一般性网络新闻报道相对应,是网络媒体表现形式中的一种主要类别。它被认为是具有网络媒体特色,最能发挥网络媒体新闻报道优势的表现形式。
如何做好网络专题策划
网络专题是网络媒体的一种重要表现形式,通常围绕某一特定主题(如突发事件,宣传主题),设计固定的专题页面,进行 图片与文字、即时新闻与相关资料。
当网络编辑发现同一主题的单条新闻可以一起做成专栏的时候网络专题的趋形便开始形成网络专题。
网络专题最早以专题栏目和专题报告两种形式出现。它们的不同之处在于访问入口的差异。专题栏目只是聚合相同主题的网 络新闻。而专题报道则是以一条重头网络新闻为主、辅以背景资料、相关报道作为链接,出现于该条重头新闻的页面链接之中,专题栏目无需编辑过多干预,至多编 写一个栏目导语。而专题报告则侧重于对报道主题的挖掘,背景资料需要历史数据库的积累,即时报道则需要时时更新。
网络专题分为事件类、主题类、挖掘类、栏目类。网络专题制作流程
好的网络编辑应具备编辑思路、栏目设置、专题构架、标题制作、版式设计、跟进维护等。
专题构思到制作流程如下:
策划选题——确定选题——提交方案(每位参与者)——负责人汇总后分发给每位参于者——每位参与者对所有方案分别进行打分——负责人根据打分情况进行加权处理——选出分值最高的方案——吸取落选方案中的亮点引入其中——专题策划定型——分工制作——完成。
网络专题的必备要素
(1)网络编辑思路。这是整 个专题的灵魂,直接决定了专题的质量水平。一个好的专题必须要有一个巧妙或独特的网络编辑思路。必须认真思索新闻背后究竞隐藏了什么。这就是网络编辑的个 人能力完美体现。
(2)栏目设置。这是专题的 骨架。处理不当必然导致整个专题内容不丰满,后天畸形。栏目设置应该运用散发性的思维,从新闻实际出发,把思路外延,构建一个内容丰满的新闻专题,然后根 据各个栏目的重要性合理分配栏目位置。
(3)专题构架。这是专题的 阅读导向的体现。好的新闻专题必须做到让读者沿着自己的编辑思路走,这样才能达到最好的传播效果。新闻专题的构架多种多样,但一个最基本的准则是——要分 清各个栏目的主次,然后按照主次合理安排各个栏目位置。
(4)标题制作。这是新闻专题的视觉刺激,如何根据新闻内容提炼一个好的标题直接决定着专题的传播效果。编辑们必须明白一 个道理:报纸的新闻标题和网络新闻标题是不一样的,报纸标题紧跟内容,读者可以浏览;而网络新闻只有一个标题,标题的好坏直接决定了新闻内容的传播效果。
(5)跟进维护。网络媒体的 报道是实时的,这就要求跟进式维护。这不仅体现在新闻的滚动播出方面,也体现在栏目的调整方面,当增则增,当减则减。
(6)版式设计。这是新闻专 题形式美的体现,无论是平面媒体还是网络媒体,可以直接推动内容的传播。
(7)外观。“内容永远滞后 于视觉”,如何让读者从看到的第一眼就被吸引住,页面效果便显得至关重要。这就要求网络编辑具备较高的审美层次和较强的鉴赏力,去构建专题框架和表现形 式。
网络专题栏目设置
网络专题内部栏目是构成整个网络专题的骨架,若处理不当,就容易导致专题内容的不丰满。好的栏目设置主要从受众需要 以及网站的服务重点出发,充分运用编辑的发散型思维,尽可能地在有限的版面上设置比较合理的、得当的栏目。一般来说,好的栏目设置的主要类型有:
(1)编者按语
所谓编者按即编辑在文稿前加上的简要评论。在网络专题中,编者按主要以文前按语居多。它的主要特点是居于文稿前面,片言居要;在行文上提纲挈领、言简意赅,用议论性的语言直接鲜明地阐述编者对此专题的基本看法和观点,帮助受众了解编辑的意图。从网络专题实践中,并 不是所有的专题都需要编者按语,而是根据专题内容的实际需要来定。
(2)要闻栏
一般也称“动态栏”。这个栏目对网络新闻专题来说,最新进展是专题的重心所在。而对于其他普通型专题,某个事件、问 题、现象等某一方面的最新进展、最新成果、最新
发现、最新的措施等应该纳入到“要闻栏”。要闻栏的篇幅有长有短。对于新闻专题来说,要闻栏可能所在版面篇 幅较大;而对于其他普通型专题,要闻栏中可以是一条或几条关键性的要闻,所在的篇幅相对就比较短小。
(3)评论栏
它主要包括权威人物、领导人的论述、重要媒体的评论、专家学者的评论、网友评论等。在专题实施中,也可以把这几项评 论分开,设置成不同的栏目。
评论栏目在更新速度上有两种:一种是要求紧跟事件、事态的发展,随时更新评论栏目的内容,特别是时事评论,要求及 时、快速;另一种是资料性的评论,更新速度较慢,有的甚至不用更新,比如已故领导人对某个问题的论述、评论,经典的理论论述等等。因此要根据专题情况适时 而动。
(4)背景栏
这也是网络专题中很重要的栏目之一。在背景栏中,网络编辑要更多、更全面地安排与事件、问题、现象有关的背景资料。其中这些背景资料主要包括解释性背景资料、对比性背景资料和说明性背景资料等等。在背景栏的整体设计中,可以考虑以多种文本形式传播,比如纯文字的、图片 的、视频的、音频的、动画的等等,力求形象、生动,同时能给广大受众更多的背景信息。
(5)受众服务栏
服务栏的设置是有较强 的针对性,主要是针对本专题的。受众可以延展专题内容甚至能挖掘专题深度,能在第一时间为网络编辑提供智力支持。因此网络编辑要充分地运用服务栏提升服务 品质,共同把网络专题做深入、做全面。
(6)受众调查栏
也称“读者投票栏”。设置该栏目也是为了与受众进行互动、联络,以期了解受众对某个事态、问题、现象等的看法。受众调查栏设置的通常 是一个问题,有的也有两三个问题。这些问题的设置通常与专题内容相关,但不涉及到专题中的具体内容。一般来说,它的主要内容是有关受众对专题内容态度、行 为的调查。
(7)小常识栏
这也是网络专题经常采用的一种栏目形式。通常情况下,一些小常识性的问题隐藏在背景资料中,但有些小常识是许多受众 关注的。在这种情况下,编辑要了解受众心理,对于一些受众关心的问题可以突出出来,帮助受众了解一些基本的知识。
第五篇:2015网络知识
中国传统文化必备知识(网络题库)
1.上古尧舜时,中国治理洪水的伟大英雄是__? 2.“卧薪尝胆”讲述的是哪位历史人物的故事? 3.战国时代儒家最著名的两位学者是__? 4.楚国最伟大的诗人是__?
5.西汉时期,中国最伟大的史学家是__?
6.被誉为“凿空”穿越西域,重新开辟丝绸之路的先导者是__? 7.东汉末年,中国历史进入三国鼎立时期,“三国”是指哪三国? 8.刘备“三顾茅庐”,力请的是哪位历史人物? 9.“程门立雪”中,杨时求教的对象是谁? 10.“六朝”古都是哪座城市? 11.修筑隋唐大运河的皇帝是__?
12.唐太宗感叹 “遂亡一镜”的名臣是__? 13.中国历史上第一位女皇帝是__?
14.以“陈桥兵变,黄袍加身”成为皇帝的是__? 15.北宋时由司马光主编的一部大型编年体史书是__? 16.北宋时期的首都是__?
17.明朝七下西洋的历史人物是__?
18.“中国”一词早在3000年前的西周时期就已出现,它最初的含义为? 19.“中国”一词在何时正式成为我国的名称?
20.“先天下之忧而忧,后天下之乐而乐”出自哪位历史人物的哪篇作品? 21.被称为画圣的唐代画家是__? 22.中国佛教四大名山是__? 23.中国道家四大名山是__?
24.“乐府双璧”指代哪两篇文学作品?
25.中国古代王朝由“禅让制”变为“世袭制”始__? 26.中国历史上最长时间的王朝是__? 27.中国历史上最早的编年体史书是__? 28.“问鼎中原”讲述的是哪位历史人物的故事? 29.“三家分晋”是指晋为哪三家所分?
30.顾炎武在《日知录•周末风俗》条中描述了一个时期“邦无定交,士无定 主”,这个时期是__? 31.“战国七雄”是指__? 32.“战国四君子”是指__?
33.“胡服骑射”改革的倡导者是__? 34.灭秦后项羽自立为__?
35.提出“罢黜百家、独尊儒术”的是汉代学者是__? 36.中国历史上第一部纪传体史书是__? 37.古代所称“三史”是指__? 38.西汉末年篡立“新”朝的是__? 39.佛教较为全面传入中国的时间是__? 40.中国道教较为成熟的出现时间是__?
41.东晋灭亡后,在南方相继兴起的四个朝代是__? 42.三国时营造“木牛流马”的历史人物是__? 43.曹操统一北方的关键性战役是__? 44.中国历史上的“北朝”是指__? 45.北魏时期最著名的地理学著作是__?
46.结束自西晋以来至南北朝分裂,使南北重新一统的皇帝是__? 47.被诸少数民族称为“天可汗”的皇帝是__? 48.唐代向中国派遣“遣唐使”的东亚国家是__? 49.在唐代重新提出中国“道统”的学者是__? 50.中国历史上的“五代”是指__? 51.历史上国号为“辽”的主要民族是__? 52.冯梦龙的代表作是__? 53.我国最早的正规类书是__? 54.朱熹注解四书的著作是__? 55.与北宋并立的重要政权是__? 56.与南宋并立的重要政权是__?
57.元代著名的天文学家、历算家郭守敬、王恂等人推算的历法是__? 58.“靖难之役”的发起者是__? 59.明代提出“心学”的著名学者是__? 60.中国古代历史上最大规模的一部类书是__? 61.中国历史上最大规模的一部丛书是__?
62.清代雍正年间裁撤西南地区大量土司,中央派遣官员到任的政策是__? 63.提出“盛世滋丁,永不加赋”的帝王是__?
64.道光十八年(1838),被清政府派到广州领导禁烟斗争的钦差大臣是__? 65.书法界中“二王”是__?
66.建于秦朝被誉为世界上“第八大奇迹”的是__? 67.变脸是我国哪个表演的绝活?
68.以兽皮或纸板做成的人物剪影,在蜡烛或燃烧的酒精等光源的照射下用隔亮 布进行表演的戏剧形式叫什么?
69.中国戏曲中的人物按角色分为生、旦、净、末、丑,哪一个是女角色的统称? 70.中国象棋的双方各有几种棋子? 71.明清两代帝王祭天的地方是__? 72.故宫建成于哪个朝代?
73.在古代,人们将乐器分为“丝”“竹”,分别指弹弦乐器和吹奏乐器,其 中哪个是指吹奏乐器?
74.宋代诗人王安石在《元日》中写道:爆竹声中一岁除,春风送暧入屠苏。千门万户瞳瞳日,总把新桃换旧符。“新桃”和“旧符”是什么意思? 75.中国绘画题中岁寒三友是__? 76.《二泉映月》是用什么乐器独奏的曲子? 77.地动仪是谁发明的?
78.爵是古代典礼时用的酒器,爵有几只脚?
79.我国历史上最早运用“望闻问切”方法进行中医诊断的是__? 80.《本草纲目》的作者是__?
81.被国内外人士誉为“中国三大国粹”的是__? 82.“颜筋柳骨”的颜是指我国历史上哪位书法家? 83.长沙楚墓出土的哪两幅画被誉为现存最古老的帛画? 84.《鹊华秋色图》是元朝哪个画家的代表作? 85.秦朝标准字体是__? 86.唐代张旭被誉为__?
87.中国国画题画诗起源于什么时期?
88.宋徽宗赵佶是为杰出的书法家,他的字以什么体著称? 89.中国四大石窟中位于河南省的是__? 90.《西厢记》是元代哪位戏剧家的作品? 100.戏剧《雷雨》的作者是__? 101.被誉为医圣的是__?
102.《清明上河图》的作者是__?
103.“玄、皂、青、苍”中,哪个字不含“黑色”的意思? 104.昆曲起源于哪个省?
105.“宋代四大书法家”是指__? 107.24节气中反映季节的有哪几个?
108.唐朝文宗御封的“三绝”指的是李白的诗歌、裴旻的剑舞和__? 109.“四羊方尊”是哪个朝代的文物? 110.我国存世最早最完整的国画作品是__? 111.唐三彩中最常见的三种颜色是__? 112.被称为“天下第一行书”书法作品是__? 113.《霓裳羽衣》是我国哪个朝代的宫廷乐舞? 114.《洛神赋图》是谁的作品?
115.阿诗玛是我国云南哪个民族塑造的艺术形象?
116.“烟笼寒水月笼沙,夜泊秦淮近酒家”中的秦淮河位于__? 117.被称为“中国17世纪工艺百科全书”的《天工开物》是谁创作的? 118.《梦溪笔谈》的作者是__? 119.中国历史上被誉为药王的是__? 120.诗三百是那部诗集的别称? 121.《诗经》共有多少篇?
122.中华民族拥有__年的悠久历史和灿烂文化?
123.中华优秀传统文化是维系中华民族繁衍生息、不断强盛的精神家园,构成 了中华民族的脊梁、血脉和__?
124.我们常说的菜系流派,其中最具影响的有“八大菜系”,即鲁、川、粤、闽、苏、浙、湘、__菜系。
125.“中华”是“中国”与“__”的合称,自古有之。126.我国古代史书体例有__? 127.中国早期的文字是__?
128.隋唐时期是中国封建社会空前鼎盛时期,其成就超过了西汉的__? 129.中华优秀传统文化在思想上有大智,在科学上有大真,在伦理上有大善,在艺术上有__?
130.《四库全书》是中国最著名的__?
131.习近平同志多次强调指出:要大力弘扬以爱国主义为核心的民族精神和以 __为核心的时代精神。
132.习近平同志指出:要深入挖掘和阐发中华优秀传统文化讲仁爱、重民本、守诚信、崇正义、尚和合、求__的时代价值。
133.加强中华优秀传统文化教育,对于引导青少年学生增强民族文化自信和_ _,自觉践行社会主义核心价值观具有重要作用。134.“师夷长技以制夷”的主张是谁提出来的?
135.清华大学的校训“自强不息、厚德载物”缘起于__在清华大学的演讲。136.爱国主义包括哪三个方面?
137.和谐是人类社会的文化心理、政治信条和__? 138.孔子说:“君子和而不同,小人同而__”
139.我国古代历史上第一次明确提出“以人为本”思想的是__? 140.古人常言:“万恶淫为首,百善__为先。” 141.勿以恶小而为之,勿以善小而__。
142.孔子是儒家思想的创始人,也是当时世界上最伟大的思想家和教育家,比 __大思想家、教育家苏格拉底、柏拉图还要早几十年。
143.《中庸》中有句名言:博学之,审问之,慎思之,明辨之,__之。144.楷书四大家指的是:颜真卿、柳公权、欧阳询、__。145.我国四大古镇指的是:江西的景德镇、广东的佛山镇、湖 北的汉口镇和__。
146.__是我国唯一土生土长的宗教。
147.汉字是世界上使用人数最多的文字,使用人数超过__亿。148.中国古代的诗歌艺术达到巅峰是什么时候?
149.宋代,词的创作达到鼎盛,产生了“婉约”和“__”两个派别。150.《楚辞》是继《诗经》以后,对我国文学具有深远影响的又一部诗歌总集,主要收录__作品?
151.“知之为知之,不知为不知,是知也”出自__?
152.“蒹葭苍苍,白露为霜,所谓伊人,在水一方”这一句诗句出自__? 153.诗句“路漫漫其修远兮,吾将上下而求索”的作者是__? 154.“富贵不能淫,贫贱不能移,威武不能屈”出自__? 155.《逍遥游》的作者是__?
156.诗句“老骥伏枥,志在千里。烈士暮年,壮心不已。”的作者是__? 157.“七月流火”意指天气转凉,还是天气渐热? 158.被称为“东方的莎士比亚”的是__? 159.下面哪幅图是范宽的名画? 160.唐代画牛最有名的画家是__? 161.我国第一部纪传体断代史是__? 162.类书巨著最有名的是哪两部? 163.建立一个完整农学体系的书是__? 164.我国最早的一部数学著作是__? 165.世界上最古老保存至今的石拱桥是__? 166.四大书院中,在湖南长沙的是__? 167.景泰蓝是漆器吗?
168.中国文化的四大特质玉、漆、丝和__? 169.文房四宝指的是笔、墨、纸和__? 170.“桑梓”指代的是__?
171.“独在异乡为异客,每逢佳节倍思亲”描写哪个节日? 172.什么节日有挂菖蒲、蒿草、艾叶的习俗? 173.“总角之宴,言笑晏晏”中“总角”代指__? 174.“耄耋之年”指多少岁? 175.西岳是指哪座山?
176.“落霞与孤鹜齐飞,秋水共长天一色”描绘了哪个名楼上看到的景色? 177.吐蕃王朝赞普松赞干布为迎娶文成公主而兴建的宫殿是__? 178.中国有着九省通衢之称的是__? 179.我国第一部针灸专著是__?
180.我国历史上的第一个农田水利工程是__? 181.世界上最早的指南仪器是__? 182.“一门父子三词客”指的是__?
183.《富春山居图》分两部分,一部分叫《剩山图》,还有一部分叫__? 184.我国茶叶种类有几大类?
185.中国文学史上三座重要的里程碑是__? 186.中国佛教四大名山中在浙江的是__? 187.我国第一部字典是__? 188.我国第一部兵书是__? 189.世界上第一部茶叶专著是__? 190.当今世界上最长的运河是__? 191.汉字六书是指__?
192.清康熙年间,戏曲界的“南洪北孔”是指__? 193.成语“五音不全”中的“五音”是指__? 194.我国古代图书分类法为__?
195.我国传统表示次序的“天干”共有多少个? 196.“四书五经”中的“四书”指的是哪四本书?
197.当今世界上规模最大、收集字数最多、释义最全的汉语字典是哪一部? 198.下面哪位诗人不是唐代的?
199.木版画发源于四大名镇中哪个名镇? 200.竹林七贤中阮咸最擅长什么?