字典对象Dictionary<K,V>我们经常会用到,而在大数据环境下,字典使用不当可能引起性能问题,严重的可能引起内在的溢出!
- 字典的值建议为简单类型,反正使用Tuple<T>
- 字典的键在查找时,时间复杂度为O(1),性能不会有任何问题,所以不要愿望它
下面代码是对500万的字典进行测试,首先赋值,然后取出一个随机机,性能在毫秒级
static void Draw() { int count = 5000000; Console.WriteLine("test:{0} feeds", count); Listlist = new List (); list.Add(new GoldCoinInfo { Id = 100, GoldValue = 5, LeftCount = count, TotalCount = count }); var dic = new Dictionary (); int _index = 0; Stopwatch sw = new Stopwatch(); sw.Restart(); foreach (var gold in list) { for (int j = 0; j < gold.LeftCount; j++) { dic.Add(_index, gold.Id); _index++; } } sw.Stop(); Console.WriteLine("step1:{0} ms", sw.ElapsedMilliseconds); sw.Restart(); var prizeIndex2 = GenerateRandom(dic.Keys.Max(), 1).FirstOrDefault(); Console.WriteLine("step3:{0} ms,value:{1}", sw.ElapsedMilliseconds, dic[prizeIndex2]); sw.Stop(); }
测试结果
而如果value使用了tuple<t>类型,那性能就一落千丈了!
var dic = new Dictionary>(); int _index = 0; Stopwatch sw = new Stopwatch(); sw.Restart(); foreach (var gold in list) { for (int j = 0; j < gold.LeftCount; j++) { dic.Add(_index, new Tuple (gold.Id, gold.GoldValue)); _index++; } }
在取随机机时,我们有时使用NewId()这试,但这种开销依然很大,不建议大家使用,这种只适合在特定的场合用,如EF对IQueryable结果集动态随机数时,代码如下
////// sql函数的扩展类 /// public static class SqlFunctionExtensions { #region 功能方法 ////// 在linq to entity中使用SqlServer.NEWID函数 /// public static Guid NewId() { return Guid.NewGuid(); } #endregion #region 扩展方法 ////// 随机排序扩展方法 /// ////// /// public static IQueryable OrderByNewId (this IEnumerable source) { return source.AsQueryable().OrderBy(d => NewId()); } #endregion }
对技术的研究我们在继续,有时,模棱两可是不行的!
有时,应该较较真!